算子简报
2025-04-11 · 算子简报
OpenAI即将发布GPT-4.1系列,包含Mini和Nano版本
•OpenAI计划在下周发布GPT-4.1系列,包含Mini版和Nano版。
•新系列将显著提升文本、图像和音频处理能力,适应不同应用场景。
•o3系列将通过独特的推理技术增强逻辑处理能力。
Pika推出创新视频编辑功能Pika Twists
•Pika Twists允许用户通过文本提示动态修改视频内容。
•用户无需专业技能即可快速生成惊艳的效果,简化了视频特效制作流程。
•该功能对所有用户开放,免费用户可体验Turbo模式。
华为与港大发布开源语言模型Dream 7B
•Dream 7B语言模型标志着扩散模型在文本生成领域的重大突破。
•该模型在性能上超越现有的扩散语言模型,具备强大的通用能力。
•它在数学、代码及规划能力上与顶尖自回归模型相媲美。
商汤科技发布日日新V6,API将开放
•商汤科技推出最新一代AI大模型“日日新V6”,在多模态能力上取得显著突破。
•该模型支持处理文本、图像和视频等多种数据类型。
•API将于明日开放,促进AI应用的快速落地。
宇树G1人形机器人展示出色拳击技能
•宇树G1机器人在搏击视频中展现精准击打和灵活性。
•G1能够在摔倒后4秒内自主站立,体现出色的恢复能力。
•宇树计划推出机器人格斗直播活动,吸引更多技术爱好者。
ChatGPT推出长期记忆功能,提升用户体验
•ChatGPT的新功能允许自动存储用户聊天记录,提供个性化回应。
•用户对记忆功能拥有完全的控制权,确保隐私安全。
•新功能提升了系统在处理复杂任务时的理解力。
Krea发布Krea Stage工具,简化3D创作
•Krea Stage允许用户从图片快速生成可编辑的3D场景。
•该工具支持跨场景视频生成,确保视觉一致性。
•Krea Stage的低门槛设计促进了创作的民主化。
Canva推出多项新AI功能,提升设计效率
•Canva发布AI助手、指令生成应用和动态电子表格等新功能。
•用户可通过自然语言与AI互动,实现多样化的设计需求。
•新功能旨在简化设计流程,提升用户创意表达效率。
OpenAI开源BrowseComp,评估AI代理能力的新基准
•BrowseComp是一个包含1266道高难度问题的基准测试。
•该测试专注于AI代理在复杂信息中的定位能力。
•OpenAI将BrowseComp完全开源,鼓励全球开发者参与优化。
LinkedIn数据显示全球AI人才集中度
•以色列以1.98%的AI人才比例位居全球第一。
•新加坡和卢森堡紧随其后,显示出强劲的AI人才需求。
•印度的AI人才集中度在2016年至2024年间增长了252%。