算子简报

2025-04-11 · 算子简报

1

OpenAI即将发布GPT-4.1系列,包含Mini和Nano版本

OpenAI计划在下周发布GPT-4.1系列,包含Mini版和Nano版。

新系列将显著提升文本、图像和音频处理能力,适应不同应用场景。

o3系列将通过独特的推理技术增强逻辑处理能力。

2

Pika推出创新视频编辑功能Pika Twists

Pika Twists允许用户通过文本提示动态修改视频内容。

用户无需专业技能即可快速生成惊艳的效果,简化了视频特效制作流程。

该功能对所有用户开放,免费用户可体验Turbo模式。

3

华为与港大发布开源语言模型Dream 7B

Dream 7B语言模型标志着扩散模型在文本生成领域的重大突破。

该模型在性能上超越现有的扩散语言模型,具备强大的通用能力。

它在数学、代码及规划能力上与顶尖自回归模型相媲美。

4

商汤科技发布日日新V6,API将开放

商汤科技推出最新一代AI大模型“日日新V6”,在多模态能力上取得显著突破。

该模型支持处理文本、图像和视频等多种数据类型。

API将于明日开放,促进AI应用的快速落地。

5

宇树G1人形机器人展示出色拳击技能

宇树G1机器人在搏击视频中展现精准击打和灵活性。

G1能够在摔倒后4秒内自主站立,体现出色的恢复能力。

宇树计划推出机器人格斗直播活动,吸引更多技术爱好者。

6

ChatGPT推出长期记忆功能,提升用户体验

ChatGPT的新功能允许自动存储用户聊天记录,提供个性化回应。

用户对记忆功能拥有完全的控制权,确保隐私安全。

新功能提升了系统在处理复杂任务时的理解力。

7

Krea发布Krea Stage工具,简化3D创作

Krea Stage允许用户从图片快速生成可编辑的3D场景。

该工具支持跨场景视频生成,确保视觉一致性。

Krea Stage的低门槛设计促进了创作的民主化。

8

Canva推出多项新AI功能,提升设计效率

Canva发布AI助手、指令生成应用和动态电子表格等新功能。

用户可通过自然语言与AI互动,实现多样化的设计需求。

新功能旨在简化设计流程,提升用户创意表达效率。

9

OpenAI开源BrowseComp,评估AI代理能力的新基准

BrowseComp是一个包含1266道高难度问题的基准测试。

该测试专注于AI代理在复杂信息中的定位能力。

OpenAI将BrowseComp完全开源,鼓励全球开发者参与优化。

详情链接
10

LinkedIn数据显示全球AI人才集中度

以色列以1.98%的AI人才比例位居全球第一。

新加坡和卢森堡紧随其后,显示出强劲的AI人才需求。

印度的AI人才集中度在2016年至2024年间增长了252%。