多模态学习的兴起:稳定扩散和 等图像生成网络的浪潮展示了 方法的强大功能,这些方法可以理解多种形式的数据——在这种情况下,图像可以生成图片,文本可以接受人类的描述。虽然多模态学习一直是一个重要的研究领域,但很难将其转化为商业世界,因为每个数据源都很难以自己的方式进行交互。不过,随着企业在数据使用方面变得越来越复杂,多模态学习在 年成为一个极其强大的机会。能够将文本、图像和视频中传达的广泛知识与金融和其他数字系列的复杂建模相结合的系统将成为许多公司业务的下一阶段数据科学举措。
我们眼中的奇点?去年 月,黄嘉欣等人发表了一篇研究论文,标题引人注目:“大型语言模型可以自我改进”虽然这还不是奇点,但研究人员诱导大型语言模型从文本片段中生成问题,通过“思 萨尔瓦多手机号码数据 维链提示”回答自我提出的问题,然后从这些答案中学习,以提高网络在各种任务上的能力。这些引导方法在历史上一直与改进有着相当紧密的联系——最终,模型开始自学错误的东西并偏离轨道——但无需费力的注释工作就能提高性能的承诺对网络来说是一种诱惑人工智能从业者。我们预测,虽然这样的方法不会让我们进入奇点时刻,但它将成为 年的热门研究课题,到今年年底,它将成为所有最先进的自然语言处理结果的标准技术。
总而言之,预计 年人工智能和机器学习的重点将转向产品化和成本效益,同时混合 解决方案的采用率也将提高。多模态学习(涉及理解文本、图像和视频等多种形式的数据)的使用也有望在企业中变得更加普遍。此外,对自我改进的大型语言模型的研究预计将继续成为该领域的重点,这些模型有可能成为自然语言处理的标准技术。然而,重要的是要考虑这些进步的潜在挑战和局限性,例如社会偏见和滥用的可能性。