无需OCR技术,mPLUG-DocOwl1.5模型助力阿里巴巴高效分析图表、网页等多样文档

最近,阿里巴巴的 AI 研究团队在文档理解领域取得了令人瞩目的进展,他们推出了 mPLUG-DocOwl1.5,这是一款在无OCR(光学字符识别)文档理解任务上表现卓越的尖端模型。 过去,处理文档理解任务时,我们通常依赖 OCR 技术来从图像中提取文本,但这往往会受到复杂布局和视觉噪声的困扰。而 m

探讨ChatGPT的公平性:用户名称对聊天机器人回应的影响分析

OpenAI最近发布了一项研究来评估ChatGPT的公平性,特别是研究用户名如何影响聊天机器人的反应并可能反映出有害的刻板印象。 研究结果显示,无论用户身份如何,ChatGPT都能提供良好的响应,并且不到1%的回复显示出有害的刻板印象。然而,根据使用的名称,响应会存在一些明显的差异。 例如,当名为“

阿里达摩院推出DocOwl 1.5开源版:表格图表轻松识别,无需OCR的高效文档解读利器!

阿里巴巴达摩院与中国人民大学近日联合开源了一款名为 mPLUG-DocOwl1.5的文档处理模型,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。 结构信息对于理解富文本图像(例如文档、表格和图表)的语义至关重要。 现有的多模态大型语言模型 (MLLM)

EPFL研究揭示:大模型性能关键在于高质量数据——训练数据的王者地位不容忽视!

瑞士洛桑联邦理工学院 (EPFL) 的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评估模型遵循指令的能力,发现在特定情况下,两种方法的表现各有优劣。 研究发现,当可用的训练样本数量较少

企鹅兰登书屋声明:坚决拒绝将图书用于人工智能训练

据《书商》报道,图书出版商企鹅兰登书屋正在以印刷形式表明其对人工智能训练的立场。新书和再版书籍的标准版权页现在将写明:“本书的任何部分不得以任何方式用于或复制用于训练人工智能技术或系统。 ” 这意味着企鹅兰登书屋不允许任何人将其出版的书籍用于人工智能训练目的。该条款还指出,企鹅兰登书屋“明确保留该作

Meta推出创新AI模型:具备自我检查与评估其他AI模型功能

快科技10月21日消息,据媒体报道,Facebook的母公司Meta近期由其研究部门宣布推出了一系列创新的人工智能(AI)模型,其中尤为引人注目的是一款具有划时代意义的自学评估器。这款工具旨在大幅减少AI系统开发过程中对人类参与的依赖。 这款自学评估器采用了先进的思维链技术,该技术能够将复杂问题巧妙

苹果AI进度落后对手两年,拟在未来两年内为全线设备搭载Apple Intelligence

就在今年的 WWDC 大会上,苹果展示了一些 AI 新特性,虽然这些功能吸引了许多用户的目光,但据业内分析师称,苹果实际上在 AI 技术的发展上落后于竞争对手约两年。相较于谷歌、微软等公司,苹果在 AI 技术的应用上明显慢了一步。 图源备注:图片由AI生成,图片授权服务商Midjourney 据知名

Perplexity AI 目标新一轮融资,估值或将达到90亿美元

近日,人工智能搜索引擎初创公司 Perplexity AI 宣布,希望在即将进行的新一轮融资中将自身估值提升到约90亿美元。 根据 CNBC 的报道,这家公司的估值在今年6月时为30亿美元,而他们目前计划筹集大约5亿美元的资金,尽管具体数字可能会有所变动,因为目前的谈判还处于保密状态。 Perple