欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、智谱 AI 全模型矩阵降价 清言智能体中心上线罗永浩“AI老罗”

智谱AI在智谱AI Open Day上宣布多款模型价格大幅降价,旗下清言App拥有超过30万个智能体活跃,日均Tokens调用量高达400亿次。罗永浩AI智能体正式入驻智谱清言App智能体中心,工号001,向全社会开放。

【AI摘要:】

🚀 智谱AI宣布GLM-4-Air和GLM-3-Turbo模型价格降至0.6元/百万Tokens,Embedding-2模型以0.3元/百万Tokens亮相。

💡 GLM-4-Flash模型最高降价至0.06元/百万Tokens。

📈 清言App拥有超过30万个智能体活跃,日均Tokens调用量高达400亿次。

详情链接:soraor.com

2、ComfyUI时间节点系统TimeUi:可快捷添加、删除或重新排列内容

这篇文章介绍了TimeUi,一个类似视频编辑工具时间线界面的ComfyUI时间节点系统。用户可以快捷添加、删除或重新排列内容,提供流畅的用户体验。TimeUi提供方便的图片上传和管理功能,支持自定义设置和各种参数调整,同时支持不同的时间格式和持续时间单位,以及Bezier曲线特性,为用户提供更加强大和灵活的时间轴节点系统。

image

【AI摘要:】

⭐ 用户可以直接上传图片至节点或附加其他“上传图片”节点,简化工作流程。

⭐ 每行时间线都包含各种自定义设置,如切换图像蒙版可见性,轻松微调输出。

⭐ 可以更改时间轴的时间格式和动画持续时间,选择以帧或秒为单位,同时支持Bezier曲线特性。

产品入口:soraor.com

详情:https://www.chinaz.com/2024/0605/1621434.shtml

3、最强辅助上线!Backseat AI:英雄联盟的免费AI游戏伴侣

Backseat AI是一款由Riot Games批准的免费AI伴侣,专为《英雄联盟》玩家设计,旨在帮助玩家提升游戏表现。玩家可以通过语音覆盖和游戏内评论获得实时的游戏建议,包括购买建议和对线策略等。AI伴侣不占用过多系统资源,支持创作者的创作和发展。

【AI摘要:】

🎮 提供实时游戏评论和建议,包括购买建议和对线策略。

🤖 主要功能包括Backseat Buddy提供实时评论和见解,赛后大厅查看比赛总结,预赛建议帮助玩家做好准备。

💡 未来版本将推出实时问答功能和多种创作者语音包,提供更多语言支持和个性化体验。

详情链接:soraor.com

4、面壁智能宣布小钢炮模型 MiniCPM 免费商用

面壁智能宣布将面壁「小钢炮」MiniCPM 免费商用,展示对开源社区的信仰和热爱。MiniCPM-Llama3-V2.5为开源社区准备的特别礼物,具有端侧多模态模型,全球受关注。特别适用于视障人士,提供强大OCR功能,改善文档阅读体验。

image

【AI摘要:】

🎁 MiniCPM-Llama3-V2.5是8B体量的端侧多模态模型,超越Gemini Pro和GPT-4V,支持30多种语言。

💼 MiniCPM 和 MiniCPM-V 模型对学术研究开放,并允许商业使用,需遵守Apache2.0和《MiniCPM 模型社区许可协议》。

🚀 MiniCPM-Llama3-V2.5具有SOTA的OCR能力,手机端高效运行,图像编码速度快150倍。

详情链接:https://modelbest.feishu.cn/share/base/form/shrcnpV5ZT9EJ6xYjh3Kx0J6v8g

5、Coze Bots用户使用情况数据分析

在这篇文章中,X博主@eviljer分享了对Coze Bots数据分析与可视化图表的展示,突出了游戏和教育类占比最高的情况。通过数据分析,可以直观了解各类目的热度和发展情况。

image

【AI摘要:】

📊 游戏和教育类占比最高,分别为20.6%和19.2%,角色类也表现不俗,占比达11.9%。

📈 数据分布紧凑性显示生活方式、游戏和效率工具类领先,学习教育类有待开发。

📉 Coze Bots十大类目数据表现包括游戏、学习教育、公开配置、角色、效率、文本创作、图像音视频、生活方式、商业服务和代码助手。

6、True Fit利用生成式AI帮助在线购物者找到合身的衣服

True Fit推出新功能"Fit Hub",利用生成式AI改善在线购物者找到适合自己身材的衣服,整合产品页面信息帮助购物者快速了解商品并确定合适尺码,减少退货率。计划推出更多功能如"Shopper Insights"和"Brand Sizing",提供更深入的个性化购物体验。

image

【AI摘要:】

⭐️ True Fit推出新功能"Fit Hub",利用生成式AI改善在线购物者找到适合自己身材的衣服。

⭐️ Fit Hub整合产品页面信息,帮助购物者快速了解商品并确定合适尺码,减少退货率。

⭐️ 计划推出更多功能如"Shopper Insights"和"Brand Sizing",提供更深入的个性化购物体验。

7、苹果将在WWDC上推iOS18 全面整合人工智能技术

苹果公司即将在WWDC上推出的iOS18将全面整合人工智能技术,带来一系列令人期待的新功能和改进。本次更新涵盖了Siri、Apple Photos、录音和Notes应用的AI支持、iMessages的AI更新以及其他AI功能,展示了苹果致力于将AI技术融入操作系统各个方面的努力。

【AI摘要:】

🌟 Siri升级:Siri将能控制应用程序内功能,登陆Apple Watch,声音更自然流畅,具备总结通知能力。

📸 Apple Photos新功能:界面全面更新,引入“清理”功能,利用AI修饰照片,内部开发Generative Playground应用程序。

🔊 录音和Notes应用的AI支持:AI总结笔记、转录音频内容到笔记,Math Notes帮助创建图形和解决方程。

8、CamCo:可控制相机的3D一致图像到视频生成

这篇文章介绍了一种名为CamCo的新颖图像到视频生成框架,通过引入Plücker坐标和极线约束注意力实现了三维一致性,同时通过结构光算法对真实世界视频进行微调,改进了对象运动的合成效果。CamCo在相机控制能力和三维一致性方面有显著改进,能够生成高质量、合理的对象运动视频。

image

【AI摘要:】

🔍 CamCo是可控制相机的3D一致图像到视频生成框架,引入Plücker坐标和极线约束注意力实现三维一致性。

🔍 在每个注意力模块中集成极线约束注意力,通过结构光算法微调真实世界视频,改进对象运动的合成效果。

🔍 CamCo通过数据筛选流程处理真实世界视频,提高生成具有相机自我运动和动态主体的视频能力。

详情链接:soraor.com

9、英伟达RTX Remix modders推出对应Comfyui节点

英伟达的RTX Remix modders推出了与Comfyui兼容的新节点,为游戏模组制作和资源增强带来了一大进步。模组制作者可以在Comfyui界面中对游戏资产进行放大和重新绘制,简化了编辑和升级过程。这一举措提供了超分辨率和PBR模型,改善了游戏的视觉效果,提升了玩家的沉浸式体验。

image

【AI摘要:】

🎮 模组制作者可以直接在Comfyui界面中对游戏资产进行放大和重新绘制,简化了编辑和升级过程。

🔧 使用新节点,模组制作者可以将RTX Remix中的游戏纹理导出到Comfyui,并通过AI模型进行批量增强。

🌟 RTX Remix Toolkit配备强大的REST API,帮助模组制作者现代化重新制作DirectX8和DirectX9游戏,推动RTX重新制作项目的创新和发展。

详情链接:https://www.nvidia.com/en-us/geforce/news/rtx-remix-rest-api-comfyui-app-connectors/

10、智谱AI宣布开源 GLM 第四代模型 GLM-4-9B

智谱AI团队于2023年3月14日开源了GLM-4-9B模型,引起了广泛关注。该模型在预训练方面引入了大语言模型进行数据筛选,训练效率提高了3.5倍。GLM-4-9B具备更强大的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等能力。

image

【AI摘要:】

🚀 GLM-4-9B模型开源,引起广泛关注

💡 预训练采用大语言模型,训练效率提高3.5倍

🔥 GLM-4-9B具备强大推理性能、多语言、多模态和All Tools能力

详情链接:https://github.com/THUDM/GLM-4

11、马斯克的Grok已经可以在xAI网站上单独访问

马斯克开发的Grok现在已经可以在xAI网站上单独访问,这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式,允许用户观察多轮对话中可能产生的不同回答路径,对于分析和理解对话流程非常有用。Grok-1.5Vision模型在多项基准测试中展现了卓越性能,超越了业界领先的GPT4V模型,尤其在RealWorldQA基准测试中表现突出。

image

【AI摘要:】

🔍 Grok现在可以在xAI网站上访问,功能更丰富

🌳 分支树模式允许观察多轮对话中不同回答路径

🚀 Grok-1.5Vision模型表现卓越,超越GPT4V和其他模型

详情链接:soraor.com

12、DreamMat:根据文字描述生成高质量基于物理渲染的材质

DreamMat是一款工具,利用几何和光照感知的扩散模型生成高质量PBR材质,消除固定阴影效果,使渲染更真实。它解决了2D扩散模型生成RGB纹理时固定阴影效果导致渲染不真实的问题。通过微调光照感知2D扩散模型,DreamMat生成与给定光照环境匹配的PBR材质,提升渲染质量。

image

【AI摘要:】

🔍 DreamMat利用几何和光照感知的扩散模型生成高质量PBR材质,消除固定阴影效果,使渲染更真实。

🌟 通过微调光照感知2D扩散模型,DreamMat生成与给定光照环境匹配的PBR材质,提升渲染质量。

💡 大量实验表明,DreamMat生成的材质对用户更具吸引力,在渲染质量上显著优于基准方法,适用于游戏和电影制作。

详情链接:soraor.com

13、马斯克将数千个AI芯片从特斯拉转移到X

本文报道了马斯克将数千个AI芯片从特斯拉转移到X的最新动向。这一举动可能对特斯拉投资者造成影响,同时也揭示了马斯克在人工智能领域的战略布局。

【AI摘要:】

🔍 马斯克订购数千个运往特斯拉的英伟达制造的AI芯片,将转移到他的社交媒体公司X。

🚗 部分英伟达处理器将优先考虑X的AI子公司xAI,而非特斯拉,可能推迟特斯拉收购处理器的时间。

💡 马斯克的人工智能初创公司xAI正与其他公司竞争,承诺提供先进产品和支持基础设施。

14、全球首个全切片数字病理学模型Prov-GigaPath问世

本文介绍了全球首个全切片数字病理学模型Prov-GigaPath的发布,该模型在癌症亚型分类和突变预测方面显著提高了病理诊断的准确性,为病理诊断提供了更加准确和可靠的工具,推动了癌症诊断和治疗的进步。

【AI摘要:】

🔍 Prov-GigaPath模型采用了两阶段的级联结构,并结合了微软研究院近期开发的LongNet架构,解决了处理和理解十亿像素级别图像的难题。

📊 Prov-GigaPath在26个任务中的25个任务上实现了最先进的性能,在18个任务上有显著改进。

💡 Prov-GigaPath在突变预测方面表现出色,在TCGA数据集上EGFR突变预测任务中,AUROC提高了23.5%,AUPRC提高了66.4%。

详情链接:https://github.com/prov-gigapath/prov-gigapath