文森特·梵高的画也许没有明显地使他看上去像一个患有抑郁和躁狂症的艺术家,但一个计算机算法可能能发现。计算机程序已经变得能够很好地通过分析一堆堆社交媒体的数据来发现有关健康的信息。
发表在公共在线知识库 arXiv.com 的研究发现:一个电脑脚本通过分析大量的张贴在 Instagram 的图片准确地预测了用户是否抑郁。
研究者寻求了 166 名 Instagram 用户的允许,分析了他们 Instagram 所张贴的状态,并询问了他们是否曾在精神健康专家那里拿到过患有临床抑郁的诊断。起初,这些研究者只用他们的算法分析了这些信息的 70% 去发现抑郁和非抑郁用户所发照片的特征。
该程序通过四个截然不同的分类来分析信息:
颜色和明亮度
照片中面孔的数量
对 Instagram 滤镜的使用
包含评论和点赞的元数据
「总体上来说,这些信息中的每一类都和人们已有的有关抑郁的研究有一定关系」,该研究的第一作者、哈佛大学的心理学和计算科学研究生 Andrew Reece 说道。
比如说,目前一些研究表明抑郁的人更喜欢较暗的颜色和更多灰色或者蓝色。Reece 说:「有证据表明,抑郁的人倾向于在更小的社会环境中与他人互动。如果照片中有大量的面孔,那么这很可能意味着你在较大的社会环境中与人互动」。人们发状态所得到的点赞或评论数量或许同样如此。
这一程序成功地从 Instagram 的数据中找到支撑这些观点的关联。来自抑郁个体的照片更加倾向于蓝色调、更暗和更灰。[抑郁的人]得到的评论可能较多,但是得到的点赞可能较少。抑郁的人可能根本就不使用任何滤镜,但当他们使用滤镜时就会选用「墨色池」这一使得所有景象都变成黑白的滤镜。
接下来 Reece 和他的合著者移除了剩下的尚未处理的 Instagram 照片中有关抑郁诊断的信息。他们将这些照片录入电脑程序,并用程序分析哪些用户抑郁了和哪些用户没有抑郁。「我们对于健康用户的判断有84%的正确率。对于真正抑郁的人,计算机找出了其中的1/3」,Reece 说到。
当程序给出一个抑郁诊断,它有 54% 的正确率,相比而言,初级医生在没有帮助的情况下正确做出抑郁诊断的概率是 42%。「这称不上是特别好的表现,但相比这些人正确率有 25% 的提高」,Reece 说道。
该研究还没有被同行评审,但看上去这一算法表现得相当不错。Reece 说这不意味着计算机程序将在诊断抑郁时取代初级医生。初级医生关注的是整体人群,而不仅是 Instagram 用户,也不会像程序一样用二元的方式将人分为抑郁和非抑郁两种类别。「你甚至不能够在正式的意义上去比较二者」,Reece 说道。
并且这一算法并不能真正像心理学家或精神病专家那样诊断某人患有抑郁或者排除其患有抑郁。理想情况下,程序也许能够帮助临床医生快速地找出那些正在挣扎和需要帮助的人。就目前而言,病人在患有抑郁和得到救治之间平均需要等待几个月时间。Reece 说:「如果某人抑郁了并且真的需要救助,但是他们并没有得到帮助,那任何可以协助他们得到评估的事物都是好的」。
实际上,使用这些信息来评估抑郁伴有法律和隐私问题。「谈论的角度是我们可以找出需要帮助的人,我们在这方面充满希望和乐观,但是,如果我们开发各种方式去监视[社交媒体数据],那么将来还会用人监视吗」,Moreno 说道。「这些程序会反过来影响人的职业或者保障吗?从某种程度上,人们认为这样的一些事情已经发生了」。
企业可能已经在收集数据从而进行此类使用了。毕竟,Tweets、Tumblr和许多 Instagram 张贴的状态对任何拥有网络的人都是开放的。❖
参考文献:
《Instagram photos reveal predictive markers of depression》