算子简报
2025-02-27 · 算子简报
DeepSeek发布并行策略升级,推动大模型训练的革命
•DeepSeek在开源计划的第四天推出了DualPipe和EPLB技术,优化了并行策略。
•这些技术旨在提升大规模语言模型训练的计算效率和资源利用率。
•DualPipe算法实现双向数据流管道,适用于千亿至万亿参数规模的模型训练。
阿里巴巴启动2026届春季实习生招聘,AI岗位占比接近50%
•阿里巴巴开放超过3000个岗位,其中近50%与人工智能相关。
•在高德和阿里云等部门,AI岗位的比例分别达到65%和80%。
•此次春招显示出阿里对AI技术的重视和对技术类岗位的持续关注。
ElevenLabs推出Scribe语音转文本模型,准确率创新高
•Scribe v1模型在多种语言中达到了最高的准确性,英语准确率为96.7%。
•该模型支持99种语言,能够在复杂音频环境中区分多达32位不同说话者。
•当前定价为每小时0.40美元,未来六周享受50%折扣。
微软发布Phi-4多模态与迷你模型,语音视觉文本处理再升级
•Phi-4多模态模型集成了语音、视觉和文本处理,参数达到5600万。
•该模型在多项基准测试中表现优异,尤其是在自动语音识别和翻译任务中。
•Phi-4迷你专注于文本处理,参数为3800万,表现同样出色。
Hugging Face推出FastRTC,简化实时语音视频应用开发
•FastRTC是一个开源的Python库,旨在简化实时音频和视频AI应用的开发过程。
•该库通过自动化复杂的实时通信功能,使开发者能够在几行代码内创建基本的实时应用。
•发布此库为AI界带来了重大机遇,促进了更加自然的人机交互方式。
FLORA推出节点式AI画布,简化创意工作流
•FLORA的节点式AI画布专为创意专业人士设计,整合多种AI功能。
•用户可以创建独立节点处理不同任务,提升创意工作效率。
•该工具支持故事分析、角色设计和团队协作,适合技术背景不深的用户。
OpenAI GPT-4.5即将发布,现身Android应用测试版
•OpenAI正在为其新一代语言模型GPT-4.5的预览版做准备,引发广泛关注。
•该模型将在ChatGPT的Android应用中作为实验性选项推出,最初向Pro订阅用户提供。
•GPT-4.5有望成为ChatGPT免费版的继承者,功能上可能会有更高的通话限制。
字节跳动豆包APP推出“照片动起来”功能,赋予静态照片新生命
•豆包APP的新功能旨在将静态老照片转化为动态视频。
•用户只需上传照片并描述动作,便可轻松实现这一转变。
•此功能体现了科技与情感的结合,为珍贵瞬间赋予了新的生命。
B站推出IndexTTS文本转语音模型,支持拼音纠正汉字发音
•IndexTTS是基于XTTS和Tortoise的GPT风格文本转语音系统。
•该模型具备拼音纠正汉字发音能力和精准的停顿控制,经过数万小时的数据训练。
•IndexTTS在字词错误率和音质评测中表现优异,超越了多款流行的TTS系统。
快手可灵AI在1月全球访问用户数环比增长113%
•快手可灵AI在1月份的全球月访问用户数环比增长了113%。
•瑞银指出,在线娱乐和教育是AI应用的核心领域。
•快手凭借其自主研发的可灵AI在全球视频生成模型中处于领先地位。
大学老师称AI作文全判0分,反映学术诚信问题
•部分高校教师指出,依赖AI生成内容的学生中存在学术不端行为。
•学校出台政策,若学生提交AI生成的作文,将被判定为零分。
•这一措施旨在强调学术诚信,反对过度依赖技术。
19岁女棋手因AI作弊被重罚,禁赛8年
•中国围棋协会对职业棋手秦思玥因在比赛中作弊行为作出严厉处罚。
•秦思玥在比赛中携带手机,利用人工智能程序作弊,情节严重。
•协会决定撤销其职业段位,并取消其比赛成绩,禁赛长达八年。
Anthropic开放Claude AI GitHub集成,提升开发者效率
•Claude AI全面开放GitHub集成功能,面向所有用户,包括免费用户和Pro用户。
•这一新功能将为开发者在编码、测试与调试工作中提供更强大的工具支持。
•开发者们能够更高效地进行项目开发,提升代码效率。