算子简报

2025-03-20 · 算子简报

1

OpenAI推出新一代AI模型o1-pro,价格引发关注

OpenAI最近推出了新一代AI模型o1-pro,旨在提供更优质的推理能力。

o1-pro的输入费用是GPT-4.5的两倍,生成费用是普通o1的十倍。

尽管价格高昂,OpenAI对其性能寄予厚望,认为其能够满足开发者对复杂任务的需求。

2

阶跃星辰开源新图生视频模型Step-Video-TI2V

上海阶跃星辰智能科技有限公司推出的Step-Video-TI2V模型在图生视频领域具有显著的创新性。

该模型基于30B参数的Step-Video-T2V,能够生成高质量的视频,并具备运动幅度和镜头运动的可控性。

Step-Video-TI2V特别适合动画创作和短视频制作。

3

腾讯混元即将发布新推理模型T1

腾讯混元宣布全新推理模型T1将于3月21日正式发布。

这一发布标志着其在人工智能大模型领域的技术迭代与产品升级。

腾讯混元大模型首次跻身Chatbot Arena全球Top15排行榜,显示出其技术实力已达到国际领先水平。

4

Open-Sora 2.0开源视频AI实现商业级画质

HPC-AI Tech推出的Open-Sora2.0是一款革命性的视频AI系统,其训练成本仅为传统系统的十分之一。

该系统通过三阶段训练过程和高效的自动编码器实现了显著的训练速度提升。

尽管在分辨率和视频时长上存在一定限制,Open-Sora2.0的输出质量媲美商业级产品。

5

波士顿动力Atlas机器人动作能力再突破

波士顿动力公司展示了其人形机器人Atlas的最新动作能力,结合强化学习与动作捕捉技术。

Atlas能够自我学习并展现出更自然、更灵活的类人动作,推动人形机器人更贴近现实应用场景。

这一技术突破在工业、医疗和救援等领域的潜在应用引发了广泛关注。

6

宇树G1人形机器人成功完成侧空翻

宇树科技的G1人形机器人成功完成了高难度的侧空翻,并稳稳落地。

这一成就展示了G1的高可靠性和成功率,引发全球科技爱好者的关注。

宇树科技发起了“机器人侧空翻真人挑战赛”,鼓励人类挑战这一高难度动作。

7

Adobe推出“Project Slide Wow”项目,简化PPT制作

Adobe在年度数字创新大会上推出的“Project Slide Wow”项目引起了市场的广泛关注。

该生成式AI驱动的工具旨在将原始客户数据快速转化为引人入胜的PowerPoint演示文稿。

这一工具极大地简化了数据分析师和市场营销人员的工作。

8

Orpheus TTS:新一代情感表达文本转语音模型

Orpheus TTS是一款新推出的开源文本转语音模型,以其超低延迟和高情感表达能力引起了广泛关注。

该模型在实时对话场景中表现出色,能够提供自然流畅的语音输出。

其开源特性为开发者提供了更多的定制化可能性,未来有望在多个领域中成为标杆。

9

LG开源EXAONE Deep模型,标志韩国自研推理AI新纪元

LG AI Research最近开源了EXAONE Deep推理AI模型,标志着AI进入了主动式AI的新纪元。

该模型以320亿参数展现出卓越的推理能力,尤其在逻辑推理和数学领域表现出色。

LG还推出了轻量级和端侧模型,保持高性能的同时,体积大幅缩小,展现出在多个行业的广泛应用潜力。

10

谷歌Chrome浏览器即将整合Gemini AI助手

谷歌Chrome浏览器即将推出Gemini AI助手的深度整合,提升用户的在线体验。

用户可以通过窗口前端的图标直接调用Gemini助手,享受自定义快捷键的支持。

尽管目前不支持侧边栏固定模式,Gemini助手将极大提升操作的便捷性。