风集谈

  • 被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

    大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...

    风集谈2025-07-24 17:37275
  • SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展

    12月13日,以“新算力 新赋能 新未来”为主题的2022 CCF全国高性能计算学术年会CCF HPC China 2022)在线上正式召开。作为高性能计算领域全球最具影响力的三大超算盛会之一,大会邀 ...

    风集谈2025-07-24 17:202162
  • 从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型

    【雷峰网(公众号:雷峰网)】雨果曾经说过:“开启人类智慧宝库的三把钥匙,即数字、字母、音符。”音乐早已成为人类表达情感的最佳载体。但音乐创作是一件门槛很高的事情,因为音乐创作不是某一个人的独角戏,而一 ...

    风集谈2025-07-24 17:161473
  • 别再声讨零一万物了

    最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...

    风集谈2025-07-24 16:36547
  • 中国正大步迈向全球创新中心

    2024年全社会研发经费投入规模增加到3.6万亿元,位居全球第二。从标杆看,深圳研发投入占GDP的比重达6.46%。中国正从全球制造中心大步迈向全球创新中心。 ...

    风集谈2025-07-24 16:29174
  • 通义千问登顶Hugging Face榜首,国产开源大模型赶超Llama2

    【雷峰网(公众号:雷峰网)消息】上周五,全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜,阿里云通义千问Qwen-72B表现抢眼,以73.6的综合得分在所有预训练模型中排名 ...

    风集谈2025-07-24 16:231624
  • 港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高

    探索 AI 和医学结合更多的可能性,是人工智能发展的一个重要命题。AutoML 作为近年来备受瞩目的概念之一,被视为解决算法工程师来提高训练模型效率的一个工具,在工业、农业、零售等诸多场景中均有被使用 ...

    风集谈2025-07-24 16:231998
  • 智谱AI狂飙:与商业化博弈的一年

    【雷峰网(公众号:雷峰网)】“这一年时间过得太快了。”2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红 ...

    风集谈2025-07-24 16:081128
  • 大模型时代的三道鸿沟:数据、成本与想象力

    跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融 ...

    风集谈2025-07-24 16:052686
  • 当「养老」遇上 AI 大模型

    作者:赖文昕编辑:陈彩娴鲜少有人关注到这样一个现象:在大模型的发展初期,「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂,新一代大模型产品经理的数量稀少,程序员往往既是技术、又 ...

    风集谈2025-07-24 16:04183
  • 价格战之后,智谱来到商业化的下一站

    「雷峰网(公众号:雷峰网)消息」刚刚过去的 5 月里,中国 AI 大模型领域掀起一场价格战,激起行业热议。这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表 ...

    风集谈2025-07-24 16:001076
  • 蓝振忠也发「英雄帖」,中国版 ChatGPT 明星公司寻找 CEO

    「打造中国OpenAI」,「西湖心辰」这家创立时间不到两年的小公司怎么敢夸下海口?相比于国内的其他创业团队,心辰具有以下几大优势:1.在大模型的研究和商业化落地要早一年。积累了超过百万的用户,并训练出 ...

    风集谈2025-07-24 15:451856

全站热门

欧洲理事会主席与伊朗总统通电话 讨论冲突解决方案

AI Infra 往事之异构计算篇:吴韧与他的学生们

黑客大会遇上元宇宙:极客精神的又一次狂欢

博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地

外交部:美对铜加征关税不符合任何一方利益

阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍

MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业

友情链接

    我要啦免费统计