当前位置：首页 > news >正文

网络大会聚焦信息检索与多模态AI技术

news 2026/6/27 19:48:05

TheWebConf: 稳定的主题，新的变化

1998年，关于谷歌排名算法的首篇研究论文在更传统的信息检索学术会议处碰壁后，最终在当时仅成立四年的新兴世界万维网大会上找到了归宿。

“它被WWW接收，是因为这是一个接纳新想法的新兴会议，”一位学者说。“它接纳新主题，行动更快，比传统学术会议更具适应性，并且对产业工作的包容性也更强。”

今年，这个曾经具有颠覆性的会议——现在简称为网络大会（TheWebConf）——获得了主流认可的又一标志，它正式被纳入计算机械协会旗下。

“今年标志着该系列会议向ACM这一全球最大的科学和教育计算协会的历史性过渡，”会议新指导委员会副主席表示。“这无疑为会议系列描绘了更光明的未来。”

增长与竞争

“五年前，我们收到了创纪录的会议投稿，”该学者说。“在966份投稿中，164份被接收。今年，投稿数量几乎是五年前的两倍。共有1,820份投稿，接收率同样为17%。会议规模急剧扩大，竞争仍然异常激烈。”

“由于接收率低，很多潜在的有趣和令人兴奋的工作无法入选。然而，会议有许多所谓的替代轨道，面向产业、海报演示和网络开发，很多新兴主题在这些轨道上获得接收。例如，电子竞技和在线游戏，在常规学术会议上评估它们会很困难——今年的网络大会为电子竞技设置了特别轨道。”

转变与趋势

这位学者指出，自他担任程序主席以来的短短五年间，会议涵盖的研究主题分布出现了一些显著变化。

“五年前的一个热门话题是众包，研究用于训练和评估机器学习模型的大规模人工数据收集方法，”他说。“但如今，它已成为为大型模型创建训练数据的主流方法。同样，不再有单独的对话系统轨道，因为对话界面已被纳入通用的搜索或推荐系统轨道。”

“在17年，我们在网络大会上引入了计算健康的新轨道，”学者补充道，“我很高兴看到今年有很多关于网络健康、以不同名义（如‘公益网络’或‘社会网络’）发表的论文。特别是在疫情期间，网络已成为健康相关活动和研究——如追踪感染率——的核心。看到它如此蓬勃发展，很有意思。”

浏览今年网络大会的议程，学者注意到了几个明显的趋势。

“用户建模一直是网络的核心部分，今年也不例外，”他说。“这都是关于尝试个性化内容，尝试建模人们如何与系统互动。我想至少有几十篇论文是关于表示用户、构建用户模型，以及尝试为他们个性化或呈现内容。而安全、隐私和信任仍然是关键问题。”

知识与多模态

最让学者感兴趣的研究趋势之一是将结构化和非结构化知识及推理融入用于对话式信息检索和推荐系统的自然语言处理模型。

“我可以举一个与我们工作密切相关的例子，”他说。“为了生成明智的回复，对话智能体需要能够以连贯的方式检测何时、如何以及在对话中融入何种知识。例如，为了推荐一部电影，智能体需要表示对话上下文，并检索关于电影本身的有用知识，理想情况下，还应提供关于是什么使这部电影适合用户的相关信息。”

“关于如何融入这些知识，已经出现了多种多样的方法，无论是通过记忆一切（将其存储为语言模型的一部分）直接将其融入生成模型，还是在运行时从各种来源检索知识，这是我们倾向于采用的方法。”

“新的方法将使我们能够更好地选择相关知识，或推理知识源中哪些部分有助于包含，因为我们有更强的能力捕捉对话上下文本身，并有更强大的模型来提取生成响应、在可能的响应中进行选择或理解用户意图所需的知识。”

“我一直在研究的另一件事是用户如何与信息检索和对话系统互动。得益于Alexa等产品，对话界面已变得无处不在，但关于这些智能体在现实世界中如何与用户互动，并结合屏幕和可用传感器等其他模态，这是一个完全开放的领域。因此，当我们拥有像Astro这样的响应式且可能自主的设备或其他在现实物理环境中与用户互动的机器人时，我们需要全新的模型来表示交互的物理环境，并将内容和用户手势与屏幕或现实世界中的所指对象联系起来。”

“本着这种精神，我们组织了Alexa Prize TaskBot挑战赛，为大学团队提供机会，开发对话式AI智能体，协助用户完成烹饪和家居装修任务。TheWebConf的用户建模轨道将是这类工作的绝佳平台。”

“研究界花了20年时间优化模型以解释网络上的用户查询和结果点击。现在我们拥有更丰富的环境和交互模态。所以你可以想象，要真正提出准确的方法来解释用户与嵌入其空间的多模态对话系统的交互，还需要我们再花20年时间。”

稳定的主题与多样性

然而，学者表示，“TheWebConf的整体主题在过去五年中保持相对稳定。只是每个轨道内的多样性持续增加。继续看到学术界和产业界的强劲代表性也令人鼓舞。这正是会议创立时的精神。”

研究领域

搜索和信息检索
对话式AI