使用AI反垃圾,保护你的iMessage
一鸣网8月6日前沿观察:(谢东霞关注人工智能、物联网)上周,苹果股价盘中突破204.83美元,市值达到1万亿美元。作为当今全球最会赚钱,现金储备最多的公司,国内的广大果粉们却陷入垃圾短信的围剿。
很多苹果用户反应iMessages的垃圾短信越来越多,举报也不起作用,每天都要收到三四条赌场、博彩广告,开发票广告、贷款之类的内容。7月31日,央视新闻也点名批评了苹果的信息管理。
面对iMessages越来越严重的垃圾信息困扰,苹果相关负责人透露,正在跟国内的电信企业接触,并探索其他可采取的方法来减轻垃圾信息带来的困扰。包括采用更先进的机器学习模型识别垃圾信息,以及推出更多的工具来阻止恶意发件账号。
AI反垃圾的建立
在此时,一个AI All in的时代,人工智能帮我们做的事越来越多了,这次苹果公司想用人工智能保护用户不受垃圾信息的侵扰,需要怎样的机器学习模型呢?
1.保持反馈最小化并尽可能延迟反馈,确保攻击者在探查你的系统时得到尽可能少的收获。
2.限制攻击者对你的系统执行测试的频率,有效降低他们设计有害有效负载的速度。
3.结合各种检测机制,增加攻击者绕过整个系统的难度。使用集成学习将基于声誉的检测方法、人工智能分类器、检测规则和异常检测等不同类型的检测方法结合起来,提高了系统的鲁棒性,因为不良行为者不得不同时制作避免所有这些机制的有效载荷。
AI反垃圾的优势
人工智能在垃圾消息防御方面的应用早有先例,去年Instagram的工程师,将标记为垃圾评论或非垃圾评论的数据的输入deep text,训练基于帖子内容本身以及其他因素来辨认负面评论的人工智能,其尝试使用九种不同的语言来检测垃圾邮件或冒犯性的评论。试图帮助 Instagram 成为一个让用户舒服表达自己的平台,不被攻击或冒犯。
为了国内网民免遭大量垃圾邮件、垃圾短信、骚扰电话等网络垃圾的轰炸,网易在2016年发布了易盾智能反垃圾云服务。依托网易反垃圾海量特征样本库,使用人工智能、大数据分析技术,对用户存储在对象存储上的图片数据进行高效甄别,并对涉及广告、色情、违禁、暴恐等垃圾类型的图片数据进行嫌疑程度的判断,同时为用户提供准确便捷的检测结果展示平台。比起企业自建内容审核体系,网易易盾能帮企业降低80%的运营成本。
AI反垃圾的局限
不过机器学习模型仍存在一定的局限性。Instagram判断评论具有冒犯性的方式,是通过机器给每一条评论进行0到1风的评级,分数越高,评论内容越恶劣。到达一定限度后,评论就会被抹除。不过在Instagram的系统中就会存在1%的误报比例,这就意味着机器删除的评论中,有1%是用户实际可以接受的。
机器学习依旧会在内置规则的影响下具有一定的局限性,文本分析公司Luminoso的首席科学家Rob Speer基于词嵌入理论创建过一套算法,试图分析文本内容的倾向性。他用人们对于餐厅的评价作为语料进行测试却得到了意料之外的结果:人们墨西哥餐馆评价很低,而事实情况则是墨西哥餐厅颇受欢迎。后来Rob Speer通过数据发现系统从网页上学到了墨西哥一词,而在互联网上,墨西哥一词往往与“非法”等负面词汇相关联,对于算法来说,这意味着一些负面的东西。
虽然人工智能不能达到人们心中的理想效果,对文本内容的评价有时会有偏差,对于一些模棱两可的内容难以判断,但也足够拯救国内果粉们被垃圾短信轰炸的惨况,希望苹果能尽快实施反垃圾的措施。