人类和AI合作改进clickbait检测
宾夕法尼亚州立大学和亚利桑那州立大学的研究人员表示,人和机器有助于训练人工智能-AI模型,其性能优于其他点击诱饵检测器。此外,基于人工智能的新解决方案还可以区分机器或机器人生成的click诱饵标题和人编写的标题之间的区别。
在一项研究中,研究人员要求人们写自己的ClickBait,这是一个有趣但具有误导性的新闻标题,旨在吸引读者点击其他在线故事的链接。研究人员还对机器进行编程,使其产生手动点击。然后,人和机器制作的标题被用作训练点击检测算法的数据。
研究人员今天(8月28日)在2019年IEEE/ACM社会网络分析进展国际会议(ASONAM)上发布了他们的研究成果。研究结果表明,该方法生成的算法在预测点击诱饵标题方面比其他系统高出约14.5%。加拿大温哥华。
该项目的首席研究员、信息科学与技术学院副教授李东原(Dongwon Lee)表示,除了在clickbait检测中的应用,该团队的方法可能有助于提高机器学习性能。Lee还是宾夕法尼亚州立大学网络科学研究所(ICS)的附属机构,该研究所为宾夕法尼亚州立大学的研究人员提供超级计算资源。
Lee说:“这个结果非常有趣,因为我们已经成功证明,机器生成的clickbait训练数据可以反馈到训练管道中,训练各种机器学习模型,从而提高性能。“这是解决监督机器学习基本瓶颈的一步,需要大量高质量的训练数据。”
根据宾夕法尼亚州立大学信息科学与技术学院博士生泰乐的说法,clickbait检测发展的挑战之一是缺乏标签数据。正如人们需要老师和学习指导来帮助他们学习一样,AI模型也需要有标记的数据来帮助他们学习如何建立正确的联系和关联。
“当我们开始这个项目时,我们意识到的一件事是,我们没有很多积极的数据点,”乐说。“为了识别clickbait,我们需要人类标记训练数据。我们需要增加正数据点的数量,以便将来能够训练更好的模型。”
媒体效果学教授、唐纳德P媒体效果研究实验室联合主任詹姆斯P吉米罗(James P. Jimirro)认为,在互联网上很容易找到点击诱饵,点击诱饵的许多变化又增加了一层难度。贝利萨里奥通信研究所和国际科学联合会附属机构。
"有些点击诱饵是列表或列表;有些点击诱饵表示为问题;有些从谁-什么-在哪里-什么时候开始;以及我们多年来在研究中发现的各种其他点击诱饵变体,”桑德说。“因此,找到所有这些clickbait类型的足够样本是一个挑战。即使我们都在抱怨身边的点击量,但当你把它们随处可见并标记出来时,就没有多少数据集了。”
根据研究者的研究,这项研究揭示了人和机器是如何接近创造标题的差异的。与机器生成的点击诱饵相比,人们生成的标题往往在标题中有更多的决定者——比如“哪个”和“哪个”。
训练似乎促成了clickbait创造的不同。例如,训练有素的作家,如记者,往往比其他参与者使用更长的单词和更多的代词。记者也可能用数字开始登上头条。
根据Sundar的说法,研究人员计划利用这些发现来指导他们调查更强大的假新闻检测系统和其他应用。
Sundar说:“对我们来说,clickbait只是构成虚假新闻的众多要素之一,但这项研究是确保我们构建一个良好的clickbait检测系统的有益准备步骤。
为了找到人类点击的作者,研究人员从在线众包网站亚马逊土耳其人那里招募了记者和工人。他们从网站上招募了125名学生和85名工人。参与者首先阅读clickbait的定义,然后被要求阅读一篇约500字的短文。然后要求参与者为每篇文章写一个clickbait标题。
机器生成的clickbait标题是使用称为变分自动编码器或VAE生成模型的机器学习模型开发的,该模型依赖于概率来寻找数据中的模式。
研究人员使用Clickbait Challenge 2017(一个在线点击检测竞赛)来测试他们具有最佳性能的算法和系统。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
- 睦清这个牌子怎么样简介(关于睦清详细介绍)
- 贵州茅台酒 国酒定制简介(关于国酒茅台定制营销 贵州有限公司详细介绍)
- 骞绘兂绾圭珷鐧惧害鐧剧简介(关于幻想纹章1.4详细介绍)
- 中国五交化影视中心详细介绍
- 互联网文化传媒公司简介(关于互联空间 上海文化传媒股份有限公司详细介绍)
- 骇客时空GU简介(关于骇客时空:GU最终编码详细介绍)
- 107鍏灞炰簬鍝釜绀惧尯简介(关于107公馆详细介绍)
- 英雄联盟手游辛吉德皮肤简介(关于SSW 游戏《英雄联盟》中的辛吉德皮肤详细介绍)
- 庭院沉睡星群密布简介(关于群星庭院详细介绍)
- 近畿国际旅行社(中国)有限公司简介(关于近畿国际旅行社 中国有限公司详细介绍)
- 抗压试验机操作简介(关于抗压试验机详细介绍)
- iu李知恩唱歌图片简介(关于你和我 IU 李知恩演唱歌曲详细介绍)
最新文章
- 今日消息 王麻子直播菜刀拍蒜一整天:45万人围观 仅卖出989件
- 今日消息 俄罗斯BQ发布新机:搭载国产虎贲T310处理器
- 今日消息 Google 版 emoji 猜词游戏,助家长引导孩子安全上网
- 今日消息 亚马逊云科技陈晓建:数据也有冷热,如何存储才能更省更快?
- 今日消息 BAT齐出手的数字藏品,是新风口还是“韭菜地”?
- 今日消息 科技股千元时代落幕:Alphabet 1拆20今日生效
- 今日消息 NVIDIA RTX 4090可能是今年推出的唯一一款Lovelace系列显卡
- 今日消息 苹果公司上线新广告 介绍耐撞击和防水溅的iPhone 13
- 今日消息 网课盛行 家长如何为孩子挑选”护眼神器“?
- 今日消息 Intel 13代酷睿i9/i7/i5都来了!狂堆小核心、跑分飞天
- 今日消息 AMD Zen4游戏神U年内杀到 208MB缓存史无前例
- 今日消息 三星上架AI修图软件“Galaxy Enhance-X”
- 今日消息 苹果布朗普顿路店将于7月28日在伦敦骑士桥开业
- 今日消息 Galaxy Z Fold 4和Flip 4的Galaxy Unpacked确认将于8月10日举行
- 今日消息 周杰伦快手独家直播已开场:瞬间破300万人气 将申请世界纪录
- 今日消息 Asahi Linux更新带来了实验性的苹果M2支持
- 今日消息 央视对话中兴:数据库为什么必须掌握在自己手里?
- 今日消息 5G手机壳,一场智商税?
- 今日消息 Nothing Phone 1官方承认存在“葫芦屏” 前摄开孔附近出现绿晕
- 今日消息 青海天峻县三伏天出现七月飞雪奇景:积雪厚度达3cm
- 今日消息 武装劫匪光天化日突袭伦敦考文特花园Apple Store
- 今日消息 做给家人吃的菜 趣店预制菜品牌战略发布
- 今日消息 iPhone 14预计9月13日发布 但iPhone 13目前销量依旧可观
- 今日消息 歌尔股份:与米哈游、三七互娱签订合伙协议 拟合计认缴5.6亿元开展创业投资活动