阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
date:2025-08-24 12:39  praise:  views:893
大模型「点火」,AI for Science 提速
在生产环节中,95% 是一个分水岭。以人为对照标准,人工的准确率在 92% 至 98% 之间,因此,行业对机器容忍度的判别标准取之中位数,未达到 95% 的部分,无论是 80% 乃至 90% 的准确率 ...
date:2025-08-24 12:33  praise:  views:1585
AI Infra 往事之异构计算篇:吴韧与他的学生们
2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...
date:2025-08-24 12:16  praise:  views:2808
AI Infra 往事之异构计算篇:吴韧与他的学生们
2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...
date:2025-08-24 11:55  praise:  views:1257
上海AI实验室开源发布高质量语料“万卷CC”
近日,上海人工智能实验室上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符100Btoken),约400G ...
date:2025-08-24 11:35  praise:  views:1010
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
【雷峰网(公众号:雷峰网)】雨果曾经说过:“开启人类智慧宝库的三把钥匙,即数字、字母、音符。”音乐早已成为人类表达情感的最佳载体。但音乐创作是一件门槛很高的事情,因为音乐创作不是某一个人的独角戏,而一 ...
date:2025-08-24 11:20  praise:  views:240
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕
6月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。大会汇聚政、产、学、研各方力量, ...
date:2025-08-24 11:05  praise:  views:953
谁将替代 Transformer?
【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...
date:2025-08-24 10:48  praise:  views:417
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
date:2025-08-24 10:35  praise:  views:2096
大模型落地,向量数据库能做什么?
在保险行业这个海量数据的“聚居地”上,数据库应用已久。近年来,保司数据化转型提速,各类文本、音视频的凭证票证核保及跑批需求不断增加,许多机构便将数据库引入至业务流程中。但是,随着数据库深入保司业务,一 ...
date:2025-08-24 10:09  praise:  views:1899