Credit:pix abay/CC0 Public Domain一种新开发的算法可以以88.39%的准确率发现Twitter用户中的抑郁症。该算法由伦敦布鲁内尔大学和莱斯特大学的研究人员开发,通过从他们的公共Twitter个人资料中提取和分析38个数据点,包括他们的帖子内容,他们的发帖时间和他们社交圈中的其他用户,来确定某人的精神状态。研究小组表示,类似的系统在未来可能会在多个平台上有一系列不同的用途,例如早期抑郁症诊断、就业筛选或警方调查。
布鲁内尔数字未来研究所所长阿卜杜勒·萨德卡教授说:“我们在两个大型数据库上测试了该算法,并将我们的结果与其他抑郁症检测技术进行了对比。”。"在所有情况下,我们都设法在分类准确性方面胜过现有技术."
该算法使用两个数据库进行训练,这两个数据库包含数千名用户的Twitter历史,以及有关这些用户心理健康的额外信息。每个数据库中80%的信息用于教导机器人,另外20%用于测试其准确性。
该机器人首先排除所有少于五条推文的用户,并通过自然语言软件运行剩余的配置文件,以纠正拼写错误和缩写。
然后,它会考虑38个不同的因素,如用户对积极和消极词汇的使用,他们的朋友和粉丝数量,以及他们对表情符号的使用,并对用户的精神和情绪状态做出决定。
使用清华Twitter抑郁症数据集,该团队的准确率达到了88.39%,而使用约翰·霍普斯金大学的CLPsych 2015数据集,准确率达到了70.69%。
“任何超过90%的都被认为是机器学习中的优秀。因此,两个数据库中的一个有88%是非常好的,”萨德卡教授说。
“这不是100%准确,但我认为在这个水平上,任何机器学习解决方案都无法实现100%的可靠性。然而,越接近90%的数字越好。”
该团队表示,这样一个系统可能会在用户将某些东西发布到公共领域之前标记出用户的抑郁症,为Twitter和脸书等平台主动标记用户的心理健康问题铺平道路。
然而,该机器人也可以在帖子进入公共领域后使用,潜在地允许雇主和其他企业根据他们的社交媒体帖子评估用户的精神状态。研究人员说,它可以被用于多种原因,包括用于情绪分析、刑事调查或就业筛选,
“提出的算法是独立于平台的,所以也可以很容易地扩展到其他社交媒体系统,如脸书或WhatsApp,”莱斯特大学机器学习教授周教授说。
“这项研究的下一阶段将是检查它在不同环境或背景下的有效性,更重要的是,这项研究提出的技术可能会进一步发展到其他应用,如电子商务,招聘考试或候选人筛选。”
这项名为“Twitter上抑郁检测的成本敏感增强修剪树”的研究发表在IEEE情感计算汇刊上。
来源:由phyica.com整理转载自PH,转载请保留出处和链接!