算子简报

2025-02-27 · 算子简报

1

DeepSeek发布并行策略升级,推动大模型训练的革命

DeepSeek在开源计划的第四天推出了DualPipe和EPLB技术,优化了并行策略。

这些技术旨在提升大规模语言模型训练的计算效率和资源利用率。

DualPipe算法实现双向数据流管道,适用于千亿至万亿参数规模的模型训练。

详情链接
2

阿里巴巴启动2026届春季实习生招聘,AI岗位占比接近50%

阿里巴巴开放超过3000个岗位,其中近50%与人工智能相关。

在高德和阿里云等部门,AI岗位的比例分别达到65%和80%。

此次春招显示出阿里对AI技术的重视和对技术类岗位的持续关注。

3

ElevenLabs推出Scribe语音转文本模型,准确率创新高

Scribe v1模型在多种语言中达到了最高的准确性,英语准确率为96.7%。

该模型支持99种语言,能够在复杂音频环境中区分多达32位不同说话者。

当前定价为每小时0.40美元,未来六周享受50%折扣。

详情链接
4

微软发布Phi-4多模态与迷你模型,语音视觉文本处理再升级

Phi-4多模态模型集成了语音、视觉和文本处理,参数达到5600万。

该模型在多项基准测试中表现优异,尤其是在自动语音识别和翻译任务中。

Phi-4迷你专注于文本处理,参数为3800万,表现同样出色。

详情链接
5

Hugging Face推出FastRTC,简化实时语音视频应用开发

FastRTC是一个开源的Python库,旨在简化实时音频和视频AI应用的开发过程。

该库通过自动化复杂的实时通信功能,使开发者能够在几行代码内创建基本的实时应用。

发布此库为AI界带来了重大机遇,促进了更加自然的人机交互方式。

详情链接
6

FLORA推出节点式AI画布,简化创意工作流

FLORA的节点式AI画布专为创意专业人士设计,整合多种AI功能。

用户可以创建独立节点处理不同任务,提升创意工作效率。

该工具支持故事分析、角色设计和团队协作,适合技术背景不深的用户。

7

OpenAI GPT-4.5即将发布,现身Android应用测试版

OpenAI正在为其新一代语言模型GPT-4.5的预览版做准备,引发广泛关注。

该模型将在ChatGPT的Android应用中作为实验性选项推出,最初向Pro订阅用户提供。

GPT-4.5有望成为ChatGPT免费版的继承者,功能上可能会有更高的通话限制。

8

字节跳动豆包APP推出“照片动起来”功能,赋予静态照片新生命

豆包APP的新功能旨在将静态老照片转化为动态视频。

用户只需上传照片并描述动作,便可轻松实现这一转变。

此功能体现了科技与情感的结合,为珍贵瞬间赋予了新的生命。

9

B站推出IndexTTS文本转语音模型,支持拼音纠正汉字发音

IndexTTS是基于XTTS和Tortoise的GPT风格文本转语音系统。

该模型具备拼音纠正汉字发音能力和精准的停顿控制,经过数万小时的数据训练。

IndexTTS在字词错误率和音质评测中表现优异,超越了多款流行的TTS系统。

详情链接
10

快手可灵AI在1月全球访问用户数环比增长113%

快手可灵AI在1月份的全球月访问用户数环比增长了113%。

瑞银指出,在线娱乐和教育是AI应用的核心领域。

快手凭借其自主研发的可灵AI在全球视频生成模型中处于领先地位。

11

大学老师称AI作文全判0分,反映学术诚信问题

部分高校教师指出,依赖AI生成内容的学生中存在学术不端行为。

学校出台政策,若学生提交AI生成的作文,将被判定为零分。

这一措施旨在强调学术诚信,反对过度依赖技术。

12

19岁女棋手因AI作弊被重罚,禁赛8年

中国围棋协会对职业棋手秦思玥因在比赛中作弊行为作出严厉处罚。

秦思玥在比赛中携带手机,利用人工智能程序作弊,情节严重。

协会决定撤销其职业段位,并取消其比赛成绩,禁赛长达八年。

13

Anthropic开放Claude AI GitHub集成,提升开发者效率

Claude AI全面开放GitHub集成功能,面向所有用户,包括免费用户和Pro用户。

这一新功能将为开发者在编码、测试与调试工作中提供更强大的工具支持。

开发者们能够更高效地进行项目开发,提升代码效率。