人脸分析:一门“新玄学”
但无论面相学如何变形,它的核心要义是不变的:利用面部特征去判断内在,,再从相似的表征去得到类似的内在判断。这离不开大量的经验和对比总结,例如我们遇见一个浓眉大眼,声如惊雷还有着宽广脸庞的男人,会下意识地想到他大概是和腾格尔一样粗犷的人,我们对腾格尔的印象会迁移到其他具有相似特征的人身上。我认为面相学不论被包装得多好,都摘不掉“伪科学”及“科学种族主义”的帽子,因为它既无法证实,也无法证伪,在每个人的表征之下,其实都是一只“薛定谔的猫”。 2. 从数到内:现代算法的读心术 莎士比亚有句名言常被引用:“一千个观众眼里有一千个哈姆雷特。”但是,在算法的眼里,哈姆雷特只是一个属于某一类别的人,一千个算法里,只能容下一个或者几个哈姆雷特。 2016年,上海交通大学研究者Xiaolin Wu 和 Xi Zhang使用四种分类器(逻辑回归、K临近值、支持向量机和卷积神经网络)及特征生成机,对1856张人脸照片进行犯罪倾向分析,通过抓取眼内角宽度、鼻唇角角度、嘴角弧度等面部差别性特征,证明了卷积神经网络能较准确地分类犯罪,正确率达89.51%,而且犯罪组的面部特征显著异于非犯罪组。然而随后,也传来各领域专业团队的质疑之声,包括Google数据团队、华盛顿大学生物学教授组等,主要质疑点包括:照片来源缺乏透明度、无法将表情与面部特征区分、没有进行女性的分析等。两位研究员后来也表示:“我们的研究仅仅是对脸部的社会心理感知,而对于人工智能算法预测的这些感知本身的有效性如何,我们的研究并没有任何结论。” 因为密集的数据正在产生,算法正在学会“读心”“猜人”。 2017年7月14日,莫斯科郊外的一栋办公大楼里,俄罗斯总理梅德韦杰夫与其他俄罗斯内阁成员正认真聆听精神科临床教授MichalKosinski的研究分享。这位来自斯坦福大学的36岁青年教授,研究领域包括了技术、人工智能及大众心理,据说他在剑桥读硕士期间的研究成果——用户在Facebook上的良好活动行为与个人品性之间的关系研究,甚至启发了赫赫有名的政治数据咨询公司——剑桥分析(Cambridge Analytica),而后者就是利用了Kosinski的研究成果去帮助特朗普成功入驻白宫。在我的新书《数文明》中,我详细地阐述了剑桥分析如何用大数据结合心理学解读大众的心理、引导美国选民的投票。 斯坦福大学精神科临床医生Michal Kosinski教授 就在俄罗斯之行的几周后,Kosinski就发表了那篇饱受争议的论文《深度神经网络比人类更能准确从脸部影像判别性取向》。该论文用神经网络分析了35326张交友网站照片,包括18~40岁之间的17641名男性和17685名女性,结果判断男性和女性是否为同性恋的正确率分别高达81%和71%,而当同一个人的分析照片达到5张,正确率可达91%和83%。 Kosinski论文中的图片获取和描述性统计分析表 利用不同面部特征对男女性取向的判断正确率(提供了5张照片的样本分析结果) 不过这项研究也因为研究过程的不严谨饱受诟病,包括照片选取是否中立、算法评测方法是否有效、Kosinski是否用过自己的照片进行测评等。 面对质疑,Kosinski的态度也有所转变,承认“想要核实研究结果的正确性,我们还必须进行更多的研究”。 还有人发现了独特的视角。2018年4月份,SabrinaHopper、TobiasLoetscher等四位研究者合作了一篇名为《从日常眼球运动预测个人性格》的论文,针对面相学进行了更加细致入微的研究。他们通过跟踪42名参与者的眼球运动,搜集了大量细微的眼球运动数据,再利用随机森林和决策树算法,成功预测了五大人格(OCEAN , Gordon W.Allport , 1897~1967)特征中的四个(神经过敏型、外向型、愉悦型和负责型)。 数据可靠地揭示了眼球运动与个人性格之间的强相关关系,而且搜集过程来源于被研究者的日常生活,摆脱了实验室搜集产生的环境干扰。论文的结论说明,在无约束现实环境中,人的眼球运动完全可以预测他的人格特征。但论文也存在缺陷,主要在于它的实用性还不足以投入现实场景应用,同时由于数据样本有限,也影响了预测结果的扩展范围。 我认为,不论这些学者的研究结果多么漂亮,但都离不开两个关键问题。 其一,样本的选取质量都非常糟糕。Kosinski的研究中,大量样本采集于社交网站,这就带来一个问题——无法排除照片发布者的交友需求主动性,也就是说,男性可能会公布更具雄性魅力的照片,而同性恋者公布的交友照片可能会更加阴柔。而眼球预测人格的研究同样不靠谱,总共只有42名参与者,5大人格分类又极粗糙,篮筐越大,投篮命中率自然就越高,这样的相关性本身并不科学。 其二,不论这些研究用了多么巧妙、先进的技巧和设计,都无法摆脱来自算法的“偏见”,这个“偏见”可能来自样本本身,也可能来自研究者本人的特征选取。 因此,跟“以貌取人”类似,算法也是戴着“有色眼镜”来看我们的内心的。 3. 傲慢与偏见:人与算法的共性 在言必称数据的时代,人们不但对自己的同胞带有偏见,数据也可能产生偏见。很多人认为,从数据得到的结果就是科学,就是客观,就是实实在在的证明和依据。这种唯数据至上论,唯数据可信论,其实就是一种“偏见”。 我们要记住,数据就像比基尼,永远只给我们揭示部分事实,所谓的大数据,再大也只是世界的一个侧面。 (编辑:通化站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |