- 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
- 编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
- date:2025-08-25 11:03 praise: views:966
- 图书市集到光影特展:华熙集团赵燕以华熙LIVE开启文化赋能商业革新
- 来源标题:图书市集到光影特展:华熙集团赵燕以华熙LIVE开启文化赋能商业革新当奥运篮球比赛的余温还在五棵松体育馆的钢结构中留存之际,华熙国际集团董事长、时代美术馆创办人及馆长赵燕就已经开始绘制这片场地 ...
- date:2025-08-25 10:48 praise: views:2973
- GRPO在《时空谜题》中击败o1、o3
- 近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...
- date:2025-08-25 10:28 praise: views:1106
- 2025北京798国际儿童艺术周启幕——“静待花开”,用艺术滋养童心成长
- 来源标题:2025北京798国际儿童艺术周启幕——“静待花开”,用艺术滋养童心成长 6月1日,2025北京798国际儿童艺术周将在798·751园区盛大启幕!本届艺术周以“静 ...
- date:2025-08-25 10:24 praise: views:2274
- 外交部:美对铜加征关税不符合任何一方利益
- 财联社7月10日电,据央视新闻,当地时间7月9日,特朗普宣布对铜征50%关税。今天,中国外交部发言人毛宁对此表示:这个问题我们立场非常明确,我们一贯反对泛化国家安全概念,我们也始终认为关税战、贸易战没 ...
- date:2025-08-25 10:09 praise: views:534
- 清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来
- 早在超算时代,清华大学高性能计算研究中心便一直是解决算力需求相关软件问题的行家。“目前 AI Infra 赛道几家国内厂商中,只有我们有过十万台服务器的超大规模国产算力集群的使用和调优经验。”汤雄超向 ...
- date:2025-08-25 10:00 praise: views:495
- 硅谷巨头要学会接受:「DeepSeek 现象」只是开始
- 2025 年的春节无疑已被 DeepSeek 霸屏。过去三年每年的春节都有一次重磅的 AI 讨论:2023 年是 ChatGPT、2024 年是 Sora,这两股风潮都是由 OpenAI 掀起,而 2 ...
- date:2025-08-25 09:32 praise: views:739
- 有史以来最拉风的看片会!《风驰赛车手》导演陆伟揭秘幕后故事
- 来源标题: 有史以来最拉风的看片会!《风驰赛车手》导演陆伟揭秘幕后故事5月27日的北京枫花园汽车电影院,引擎轰鸣声此起彼伏。由酷酷综、优酷体育联合Golfroom共同举办的“300码CLU ...
- date:2025-08-25 09:09 praise: views:1155
- 万兴科技正式布局AIGC赛道 首款AIGC产品万兴AI绘画开启公测
- 11月10日,2022全球元宇宙大会“数字人技术与应用场景专场论坛”举办,元宇宙创作者经济A股上市公司万兴科技300624.SZ)在论坛中正式宣布与优链时代达成战略合作。结合万兴科技在视频领域的长期积 ...
- date:2025-08-25 08:42 praise: views:2444
- 大模型隐藏玩家上桌:DeepSeek 向左,面壁向右
- 作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后,玩家已逐步分化为三种趋势:一类玩家仍追随 OpenAI 的脚步卷大参数基座模型,另外一类烧不起钱的玩家转头拥抱应用端,而第三类则自始至终都在摸索如何更高效打造 ...
- date:2025-08-25 08:41 praise: views:2681