被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...
date:2025-07-13 02:32  praise:  views:1325
IDEA研究院发布DINO
计算机视觉技术在真实世界的应用场景十分广泛。然而,过去主流的小模型方案,难以应对碎片化、多变的长尾需求,限制了技术落地规模。源自自然语言研究的Transformer架构诞生后,视觉模型与之结合,走上一 ...
date:2025-07-13 02:23  praise:  views:342
IDEA研究院发布DINO
计算机视觉技术在真实世界的应用场景十分广泛。然而,过去主流的小模型方案,难以应对碎片化、多变的长尾需求,限制了技术落地规模。源自自然语言研究的Transformer架构诞生后,视觉模型与之结合,走上一 ...
date:2025-07-13 01:57  praise:  views:1917
第16届巴黎中国电影节开幕
来源标题:第16届巴黎中国电影节开幕第16届巴黎中国电影节26日晚在法国巴黎凯旋门附近的巴尔扎克电影院开幕。本届电影节将展映19部中国电影,呈现中国影像的独特叙事魅力。据介绍,本届电影节展映的影片包括 ...
date:2025-07-13 01:44  praise:  views:968
黑客大会遇上元宇宙:极客精神的又一次狂欢
1993年的拉斯维加斯,18岁的 Jeff Moss 正准备面临一场悲伤的别离。他的一位黑客朋友由于爸爸工作调动即将离开美国,为了给这份友谊再留下些纪念,Jeff 决定给朋友办一个盛大的告别 Part ...
date:2025-07-13 01:43  praise:  views:913
实测豆包1.5后,看到了字节不走捷径的底气
2025 年 1 月,豆包大模型 1.5 全面上线火山方舟,其中豆包通用模型 pro 在多个权威测评集综合得分优于GPT4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水 ...
date:2025-07-13 01:07  praise:  views:2836
清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来
早在超算时代,清华大学高性能计算研究中心便一直是解决算力需求相关软件问题的行家。“目前 AI Infra 赛道几家国内厂商中,只有我们有过十万台服务器的超大规模国产算力集群的使用和调优经验。”汤雄超向 ...
date:2025-07-13 00:57  praise:  views:251
以美育人,让童年有“戏”——我国儿童剧演出现状与发展调查
来源标题:以美育人,让童年有“戏”——我国儿童剧演出现状与发展调查编者按美育是审美教育,也是情操教育和心灵教育,不仅能提升人的审美素养,还能激励人的精神,温润人的心灵。儿童剧作为融合了美术、音乐、舞蹈 ...
date:2025-07-13 00:09  praise:  views:1176
多地官宣:音乐节可在现场领结婚证
每经编辑|何小桃音乐节可以在现场领证。据新疆广播电视台报道,7月12日至7月13日,2025新疆超级草莓音乐节将在乌鲁木齐市水磨沟区天山明月城火热开唱。此次音乐节不仅有超燃的音乐盛宴,更有一系列“花式 ...
date:2025-07-13 00:03  praise:  views:2972
当咖啡杯邂逅千年蜀韵:瑞幸首次联名非遗,带火三大四川瑰宝
来源标题:当咖啡杯邂逅千年蜀韵:瑞幸首次联名非遗,带火三大四川瑰宝“跟着世运”游成都、“跟着展演”游成都、“到成都街头走一走”& ...
date:2025-07-12 23:51  praise:  views:363