阿里巴巴开源视频模型Wan2.1震撼发布,个人电脑也能跑,性能碾压众多竞品

阿里巴巴发布全新的开源视频模型Wan2.1,支持图片生成视频、文本生成视频、视频编辑等任务。 Wan2.1拥有四个不同的型号: ✅ 全球领先的 AI 视频生成模型,支持 720P 高清视频 ✅ 适合普通 GPU 运行,无需超级计算机 ✅ 完全开源,适用于个人开发者、研究人员、影视制作团队 ✅ 支持多

《Gibberlink:AI间的隐秘对话,速度秒杀人类语音80%!》

Gibberlink 是一个展示两个对话式 AI 代理如何从英语切换到声音级别协议(sound-level protocol)的开源项目,它探索了 AI 之间的通信优化。 该项目的核心思想是:当两个 AI 代理意识到彼此都是 AI 时,它们会从普通的文字对话(英语)切换到一种特殊的更高效的基于声音的

ElevenLabs推出ElevenReader Publishing:免费将书籍转有声读物,还能赚钱!

目前全球只只有不到 5% 的书籍以有声书形式发布,这意味着大量文学作品无法以音频形式触达更广泛的受众。 ElevenLabs宣布推出 ElevenReader Publishing,这是由ElevenLabs开发的一个新服务,旨在帮助作者将他们的书籍快速、零成本地转换为沉浸式有声书,并通过 Elev

Gemini 2.0 Flash-Lite API 重磅发布:每百万token仅0.075美元,三大应用场景解析

Google Gemini 2.0 Flash-Lite API现已全面开放,开发者可以通过 Gemini API 在 Google AI Studio 和 Vertex AI 上使用。 性能提升:相比 Gemini 1.5 Flash,Gemini 2.0 Flash-Lite 在推理能力、多模态

Adobe Photoshop iOS版重磅上线!免费功能全解析,手机网页无缝切换体验

Adobe宣布将Photoshop带到移动设备,并扩展网页版功能。iPhone版的Photoshop现已发布,Android版本将在今年稍晚推出。 订阅后两个平台可以同步项目,用户可以在不同设备之间无缝切换,例如可以在移动端、桌面和iPad上都访问自己的作品。 适用于手机版的 Photoshop 提

Raycast AI Extensions:用自然语言操控电脑应用,无需代码轻松执行任务

Raycast推出了AI Extensions(AI扩展)的beta版,面向Pro用户。用户通过自然语言输入(如简单的命令)即可让 Raycast AI 自动帮你在电脑上执行任务,而无需打开任何应用程序。 自然语言交互 核心特点: 用户可以使用自然语言输入指令,无需学习复杂的操作步骤或界面。 实现方

DeepSeek-R2爆5月前上线!第三弹DeepGEMM

DeepSeek开源第三弹,是支持稠密和MoE模型的FP8计算库——DeepGEMM,支持V3/R1训推。仅凭300行代码,就超过了专家优化的内核。开发者惊叹:DeepSeek有最好的GPU工程师,仿佛拥有某种编译器黑魔法!更令人兴奋的是,DeepSeek-R2有望在5月前提前发布。 第三天,Dee

深度研究:提示词模板全攻略

Deep Research 提示词模板参考 主要分成下面几个部分:背景信息、任务要求和输出格式 背景信息,所有对于它生成有帮助但是访问不到的信息,比如- 付费文章(它访问不到的)- 视频文字稿(它不能看视频)- - 图片或 PDF(作为附件即可)- 其他任何对于生成有帮助的信息 注意背景信息多的话要