物理科技生物学-PHYICA

WhatsApp上的垃圾邮件处理解决方案

技术工程 2022-06-04 21:53:55

whatsappCredit:pix abay/CC0 Public Domain一名罗格斯大学的研究人员开发了一种技术,可以帮助WhatsApp识别公共群中的垃圾发件人,并为WhatsApp用户自动过滤垃圾邮件和垃圾短信。这项名为“在端到端加密时代抛弃垃圾短信:WhatsApp案例研究”的研究将在2022年网络大会上发表。研究人员检查了来自印度5051个与公共政治相关的WhatsApp公共政治团体的260万条信息,分析了垃圾信息的内容、网址和模式。

WhatsApp是全球最受欢迎的移动通讯应用,拥有超过20亿用户。

垃圾邮件——被定义为管理员对某个群体不感兴趣或不合适的邮件——的流行程度远高于研究人员的预期。根据这项研究,发布到这些群组的近十分之一的信息是垃圾信息。

罗格斯大学传播与信息学院图书馆与信息科学助理教授基兰·加里梅拉说:“对于那些被垃圾邮件轰炸的人来说,清除无用信息是提高信息消费的关键,也是减少用户经济负担的关键。一些垃圾邮件发送者旨在窃取用户的信用卡信息。"

研究发现,最普遍的垃圾是招聘广告,占了数据集的近30%。其他垃圾信息包括“点击赚钱”,鼓励点击某个网址并承诺奖励。7.7%的垃圾邮件提供待售商品,而7.5%的垃圾邮件提供礼品作为推荐用户订购在线服务的回报,并且大多包含可供点击的URL。

研究人员开发了调节WhatsApp公共群体的方法。与电子邮件和Twitter等消息系统不同,WhatsApp无法读取或审核用户内容,因为端到端加密。虽然这确保了用户隐私,但WhatsApp无法调节内容,这意味着垃圾邮件和垃圾邮件发送者发布的不想要的消息可能会影响用户在该平台上的体验。

根据这项研究,垃圾邮件发送者在许多群组中发帖,通常会出现和消失几次,以避免被管理员发现和删除。

垃圾邮件发件人在几天的“活跃”时间里传播相同的垃圾邮件。加里梅拉说,这种策略可能会通过在最近的邮件中提供更长的“保质期”来提高垃圾邮件的可见性。

垃圾邮件的一个重要标志是URL和电话号码。近90%的垃圾邮件包含电话号码、网址或两者兼有(相比之下,36%的非垃圾邮件包含电话号码和网址)。研究人员创建了一个编码模型,使用URL和电话号码自动检测垃圾邮件。他们说,这可以帮助WhatsApp管理员快速标记和删除这些消息。

从用户的角度来看,研究人员创建了一个模型,在这个模型中,用户对一个信号进行编码,以检测一条消息是否包含电话号码、URL、两者或都不包含。

“我们的方法非常实用,”加里梅拉说。“WhatsApp可以应用它们来阻止垃圾邮件在他们的群体中传播,我们的技术可以在平台上集中使用,同时仍然尊重WhatsApp为用户提供的端到端加密保证,以保护他们的隐私。”

作为减少WhatsApp公共群组垃圾信息的广泛努力的一部分,Garimella和他的合著者正在与WhatsApp共享他们的注释数据集和代码,并公开供其他研究人员使用。

这项研究发表在arXiv上。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/17621.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~