当前位置: 首页 > news >正文

网络大会聚焦信息检索与多模态AI技术

TheWebConf: 稳定的主题,新的变化

1998年,关于谷歌排名算法的首篇研究论文在更传统的信息检索学术会议处碰壁后,最终在当时仅成立四年的新兴世界万维网大会上找到了归宿。

“它被WWW接收,是因为这是一个接纳新想法的新兴会议,”一位学者说。“它接纳新主题,行动更快,比传统学术会议更具适应性,并且对产业工作的包容性也更强。”

今年,这个曾经具有颠覆性的会议——现在简称为网络大会(TheWebConf)——获得了主流认可的又一标志,它正式被纳入计算机械协会旗下。

“今年标志着该系列会议向ACM这一全球最大的科学和教育计算协会的历史性过渡,”会议新指导委员会副主席表示。“这无疑为会议系列描绘了更光明的未来。”

增长与竞争

“五年前,我们收到了创纪录的会议投稿,”该学者说。“在966份投稿中,164份被接收。今年,投稿数量几乎是五年前的两倍。共有1,820份投稿,接收率同样为17%。会议规模急剧扩大,竞争仍然异常激烈。”

“由于接收率低,很多潜在的有趣和令人兴奋的工作无法入选。然而,会议有许多所谓的替代轨道,面向产业、海报演示和网络开发,很多新兴主题在这些轨道上获得接收。例如,电子竞技和在线游戏,在常规学术会议上评估它们会很困难——今年的网络大会为电子竞技设置了特别轨道。”

转变与趋势

这位学者指出,自他担任程序主席以来的短短五年间,会议涵盖的研究主题分布出现了一些显著变化。

“五年前的一个热门话题是众包,研究用于训练和评估机器学习模型的大规模人工数据收集方法,”他说。“但如今,它已成为为大型模型创建训练数据的主流方法。同样,不再有单独的对话系统轨道,因为对话界面已被纳入通用的搜索或推荐系统轨道。”

“在17年,我们在网络大会上引入了计算健康的新轨道,”学者补充道,“我很高兴看到今年有很多关于网络健康、以不同名义(如‘公益网络’或‘社会网络’)发表的论文。特别是在疫情期间,网络已成为健康相关活动和研究——如追踪感染率——的核心。看到它如此蓬勃发展,很有意思。”

浏览今年网络大会的议程,学者注意到了几个明显的趋势。

“用户建模一直是网络的核心部分,今年也不例外,”他说。“这都是关于尝试个性化内容,尝试建模人们如何与系统互动。我想至少有几十篇论文是关于表示用户、构建用户模型,以及尝试为他们个性化或呈现内容。而安全、隐私和信任仍然是关键问题。”

知识与多模态

最让学者感兴趣的研究趋势之一是将结构化和非结构化知识及推理融入用于对话式信息检索和推荐系统的自然语言处理模型。

“我可以举一个与我们工作密切相关的例子,”他说。“为了生成明智的回复,对话智能体需要能够以连贯的方式检测何时、如何以及在对话中融入何种知识。例如,为了推荐一部电影,智能体需要表示对话上下文,并检索关于电影本身的有用知识,理想情况下,还应提供关于是什么使这部电影适合用户的相关信息。”

“关于如何融入这些知识,已经出现了多种多样的方法,无论是通过记忆一切(将其存储为语言模型的一部分)直接将其融入生成模型,还是在运行时从各种来源检索知识,这是我们倾向于采用的方法。”

“新的方法将使我们能够更好地选择相关知识,或推理知识源中哪些部分有助于包含,因为我们有更强的能力捕捉对话上下文本身,并有更强大的模型来提取生成响应、在可能的响应中进行选择或理解用户意图所需的知识。”

“我一直在研究的另一件事是用户如何与信息检索和对话系统互动。得益于Alexa等产品,对话界面已变得无处不在,但关于这些智能体在现实世界中如何与用户互动,并结合屏幕和可用传感器等其他模态,这是一个完全开放的领域。因此,当我们拥有像Astro这样的响应式且可能自主的设备或其他在现实物理环境中与用户互动的机器人时,我们需要全新的模型来表示交互的物理环境,并将内容和用户手势与屏幕或现实世界中的所指对象联系起来。”

“本着这种精神,我们组织了Alexa Prize TaskBot挑战赛,为大学团队提供机会,开发对话式AI智能体,协助用户完成烹饪和家居装修任务。TheWebConf的用户建模轨道将是这类工作的绝佳平台。”

“研究界花了20年时间优化模型以解释网络上的用户查询和结果点击。现在我们拥有更丰富的环境和交互模态。所以你可以想象,要真正提出准确的方法来解释用户与嵌入其空间的多模态对话系统的交互,还需要我们再花20年时间。”

稳定的主题与多样性

然而,学者表示,“TheWebConf的整体主题在过去五年中保持相对稳定。只是每个轨道内的多样性持续增加。继续看到学术界和产业界的强劲代表性也令人鼓舞。这正是会议创立时的精神。”

研究领域

  • 搜索和信息检索
  • 对话式AI

标签

  • 常识推理
  • 多模态交互
  • 学术合作
  • 网络大会
    更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
    对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
http://www.cnnetsun.cn/news/149247.html

相关文章:

  • 15分钟搞定:用快马平台构建Homebrew更新管理原型
  • 生成式AI vs 预测式AI:揭秘人工智能领域的两大技术
  • 如何通过FaceFusion实现高质量的人脸表情迁移?
  • 10倍性能提升!Loki TSDB引擎如何重构日志索引体系
  • FaceFusion在直播场景中实现AI换脸的可能性探讨
  • 揭秘Open-AutoGLM黑科技:如何一键完成百份办公文档智能分类与转换
  • seL4微内核:构建物联网安全的终极解决方案
  • FaceFusion人脸替换黑科技:支持表情迁移与年龄变化
  • 5个技巧让LabelImg标注效率翻倍:从新手到专家的实战指南
  • 终极Dolby Vision处理工具:dovi_tool完整使用指南
  • Open-AutoGLM如何实现智能菜谱生成:从食材识别到全流程自动化的关键技术解析
  • Corne分体键盘终极选择指南:标准版与Mini版的深度体验对比
  • 3步搞定磁盘类型监控:Node Exporter精准实现方案详解
  • FaceFusion开源镜像上线:支持高精度人脸替换与实时处理
  • FaceFusion与Hugging Face模型库无缝对接
  • FaceFusion提供免费试用Token吸引新用户
  • 新手必看:PKIX路径构建失败问题快速入门指南
  • FaceFusion在AI法律顾问咨询中的形象亲和力建构
  • 企业如何有效防御CVE-2025-33073漏洞攻击?
  • 告别手动清理:Git工作树自动化工具对比
  • AI如何帮你自动生成Linux定时任务脚本?
  • 企业内网环境实战:Linux服务器离线部署Docker全记录
  • 终极指南:ATmega328多协议发射模块配置与固件烧录完全手册
  • Wan2.1视频生成模型:消费级GPU上的专业级创作革命
  • HTMLProofer终极指南:确保你的HTML文件质量无忧
  • Three.js电商3D商品展示实战案例
  • 3步实现Open-AutoGLM健康数据智能归集与实时分析(工程师都在用)
  • Java系统信息库代码质量保障终极指南:构建可靠跨平台监控应用
  • 【稀缺技术曝光】:Open-AutoGLM内部架构与自动化逻辑深度拆解
  • 从零开始掌握Exposed:JetBrains官方Kotlin ORM框架实战指南