上海AI实验室开源发布高质量语料“万卷CC”
近日,上海人工智能实验室上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符100Btoken),约400G ...
date:2025-07-12 16:14  praise:  views:993
国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地
12月28日,由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将有助于提升大模型在医疗领域的专业 ...
date:2025-07-12 16:08  praise:  views:1397
Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”
随着「百模大战」进入白热化阶段,通用大模型的优势和弊端都已渐渐显露。与此同时,能应用在特定行业的垂直大模型,具备优越的落地场景,有更多来自市场的切实需求。利亚德集团的动作大模型便是行业垂直大模型的代表 ...
date:2025-07-12 15:59  praise:  views:1545
大模型落地,向量数据库能做什么?
在保险行业这个海量数据的“聚居地”上,数据库应用已久。近年来,保司数据化转型提速,各类文本、音视频的凭证票证核保及跑批需求不断增加,许多机构便将数据库引入至业务流程中。但是,随着数据库深入保司业务,一 ...
date:2025-07-12 15:51  praise:  views:2005
吉祥航空通报一航班发动机启动阶段出现机械故障
7月10日,@吉祥航空 发布关于7月9日HO1860航班情况的说明:7月9日,公司广州飞往上海浦东的HO1860航班未能按时起飞,在发动机启动阶段出现机械故障,机组按程序处置滑回航站楼执行排故工作,为 ...
date:2025-07-12 15:25  praise:  views:2217
别再声讨零一万物了
最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...
date:2025-07-12 15:14  praise:  views:606
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...
date:2025-07-12 15:05  praise:  views:2705
周伯文:下一代大模型 OS,工具和语言缺一不可丨GAIR 2023
作者丨孙溥茜编辑丨陈彩娴编者按:2023 年 8 月14日,第七届 GAIR 全球人工智能与机器人大会在新加坡乌节大酒店正式开幕。论坛由 GAIR 研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主 ...
date:2025-07-12 14:59  praise:  views:2600
AI Infra 往事之异构计算篇:吴韧与他的学生们
2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...
date:2025-07-12 14:47  praise:  views:1559
RASP技术,"入侵者"如何成为网络安全"守护神"?
作者丨赖文昕编辑丨陈彩娴应用安全危机四伏2024年的网络安全形势依旧严峻。2月,澳大利亚电信公司 Tangerine 遭遇网络攻击,导致23万人的个人信息泄露;3月,人工智能图像编辑工具 Cutout ...
date:2025-07-12 13:43  praise:  views:2387