2024年9月20日

位于清华科技园中的Ricci睿奇餐厅提供了从披萨到意面的各种西式简餐,午餐时段这里熙熙攘攘。

除了就餐,提供了类似于第三空间职能的Ricci还成了许多合作最初开始的地方,比如投资人来公司实地探访会选择在这里吃午饭,而如果你看到两个人在Ricci面对面正襟危坐,那么他们大概率是在面试,2023年以来,面试的主题几乎都是大模型。

之所以选择Ricci,是因为对坐落于清华创业园中的大模型公司来说,它的地理位置实在是很方便。比如智谱AI,它的两个办公地分别位于Ricci北面的赛尔大厦和一条马路之隔的搜狐网络大厦。

举个例子来说,智谱的GLM-130B模型是少见的可以和GPT-3175B掰掰手腕的模型,用CEO张鹏引述斯坦福模型评测的结果来说,GLM-130B的准确性、恶意性与GPT-3持平,鲁棒性方面甚至更胜一筹。8月31日,首批获网信办批准向公众提供大模型产品服务的公司中,智谱占有一席。

另一个例子是,尽管是一家成立于2019年的创业公司,智谱已经在涉及大模型链路的许多方面推出了许多产品,这里面不仅有各种尺寸的通用大模型,还有基于通用模型而来的对话产品智谱清言,基于华为MindSpore框架的代码模型CodeGeeX,文生图模型CogView以及多模态对话模型VisualGLM,甚至还有硬件。

根据公开资料,就在9月,超云联合英特尔与智谱AI推出了大模型训推一体机,这台采用异构加速架构,搭载了英特尔至强处理器的一体机预装了智谱的定制模型和标准商用模型。

从软件到硬件,从算法到产品,智谱不仅一手打造了一个人工智能产品系列,更重要的是从数据到训练集群运维再到核心算法,智谱都实现了完全的自研。这看上去完全不像一个初创公司的,甚至有些奢侈的做派倒是和大洋彼岸的OpenAI做法十分类似,眼花缭乱的模型和产品始终围绕着AGI通用人工智能这个一致的目标,基于这个目标来组织各种技术和人才资源,并果断All In其中,也无怪乎有人说,这家清华系背景的大模型公司是中国最像OpenAI的公司之一。

智谱所在的清华创业园毗邻清华,从某种意义上说,这座中国最著名的高等学府给了智谱全自研架构的底气。

智谱成立背后的主导人物唐杰,他是清华计算机系的教授,也是中国在人工智能和大模型领域颇具话语权和声量的学术领军人物,彼时全球最大的万亿级超大规模预训练模型悟道2.0正是由唐杰主导开发的。

在智谱团队中,清华系占据相当比重,从网上公开的清华大学知识工程研究室团队中我们能看到,智谱的CEO张鹏、董事长刘德兵和总裁王绍兰的名字都位列其中。

因此当我们回顾智谱成立的来龙去脉,或许会对那句官方介绍中“源自清华技术成果”有更深的理解。智谱不是一家试图抢占这一波人工智能浪潮身位的,匆忙成立的公司,而是在产学研这条链路上走的最快、最紧密的清华计算机系在技术实力发展到一定程度的时候,自然而然的结出的果实,翻开智谱的官网,在公司发展历程介绍中的时间点不是从2019公司成立,而是从2006年算起的,那一年,这支团队发布了名为AMiner的产品用以“科研情报挖掘”,据说正是这项技术让智谱积累了最早的一批客户,换而言之,这家估值超过10亿美金的AI独角兽,在技术沉淀上并不能算做一家初创公司,而智谱从诞生之初就始终保持着和清华强有力的联系,在大模型人才颇为短缺的中国成为了一种不容忽视的优势。张鹏曾表示过,GLM模型训练和开发阶段,智谱和清华大学一直在“联合研究”。

2020年OpenAI发布了GPT-3,这个时间点恰逢智谱AI成立一周年,根据公开采访,一直紧盯着全球人工智能进展的智谱几乎立刻就意识到了它的潜力,在公司生日的庆祝活动上,张鹏已经开始和周围的人探讨GPT-3所代表的技术方向,一个稠密的、有千亿参数规模的超级大模型,或许会带来人工智能的突破。在此之前,张鹏的团队尝试过各种方法提高模型的参数量和准确性,但效果都不够理想。

GPT的出现最终让智谱决定All In超大规模参数大模型方向,一年之后,智谱的百亿参数大模型发布了,在当时绝大部分人还根本不知道这意味着什么,又过了一年,GLM-130B诞生。

先发优势显著的智谱最终打造出的不止是一个通用大模型,更是一个全新的预训练模型框架,GLM是 general language model 的缩写,翻译过来就是通用语言模型,在这个框架里智谱试图结合GPT和谷歌Bert等各种预训练模型框架的优点,2022年8月,也就是ChatGPT发布前三个月,千亿参数的超大规模预训练模型GLM-130B发布。它不仅在综合性能上和GPT-3有一战之力,还可以在更便宜的服务器上进行推理——由于采用了和GPT不同的架构,GLM-130B甚至可以在四张24G显存的RTX3090显卡上运行。

如果把百度发布文心一言当做国内百模大战正式开打的标志,那么智谱领先了所有人整整7个月,实际上就在文心一言发布的前两天,ChatGLM-6B ——基于GLM的双语对话模型就率先发布了,由于参数量小,ChatGLM-6B 仅靠消费级显卡就能运行,在今年7月,智谱更是把它和它的迭代升级版ChatGLM2-6B开源。

模型的强劲实力成了智谱对外合作的敲门砖,在相当一段时间内,客户甚至没有什么别的更好的的选择。从360到美团、金山,智谱的模型在客户中的受欢迎程度就像它的模型在huggingface trends排行榜的位置一样高,自然而然的,智谱的融资也异常顺利——某种程度上讲,是智谱在挑选投资者,而不是相反。

这造成了一个很有趣的现象,智谱刚刚完成的B-4轮融资中,腾讯和阿里巴巴据悉都是参投方。能让历来王不见王的阿里和腾讯同时挹注,足见智谱的实力不仅得到广泛认可,而且某种程度上甚至具有一定的排他性——市面上找不到和智谱旗鼓相当的对手让腾讯和阿里分别下注了,要知道上一次这两位巨头投资同一家公司还得回溯到2016年的滴滴,当时的滴滴已经确立了自己在移动出行领域的绝对优势。

清华系背景、强大模型性能还有客户的认可共同形成了外界对智谱的评价:有人、有技术、有客户的三有企业。

在2023年下半年,行业中对百模大战下一阶段是什么的回答大多聚焦于用行业数据训练垂直大模型,然而智谱看上去垂直大模型不太感冒。

或许在智谱看来,大模型带来的智能涌现还远未到达尽头,其潜力还有很多可以挖掘的空间,这个时候的主要任务应该是进一步提升大模型的能力,至于垂直行业大模型,那完全可以通过微调实现。

被誉为AI天才,目前正在大模型创业的杨植麟也曾表达过同样的看法——行业模型最终还是要回归到通用大模型上去。巧合(或许也没那么巧合)的一点是,杨植麟本科毕业于清华大学计算机系,他的老师之一,正是唐杰。

与他们的思路不谋而合的还有OpenAI,尽管我们还不知道GPT-5的开发进度(甚至开发有没有开始),但下半年来OpenAI的动作没有一个和所谓垂直大模型有关,相反,OpenAI在竭尽全力提升通用大模型的能力与实用性,比如引入Code Interpreter代码解释器,把新升级的文生图模型DALL·E3和ChatGPT结合起来,甚至允许用户通过图片和实时语音与大模型互动。

许多人把8月31日第一批大模型应用向全社会全面开放作为一个节点,但同ChatGPT带来的破圈效应相比,全面开放的国内大模型应用似乎没有激起太大的水花,这背后同样也反应了通用大模型能力不足的问题,换而言之,推动通用大模型能力持续提升依旧是目前这个阶段中国大模型竞赛玩家的首要任务,百模大战还在继续,但大家的能力差距正在逐步展现。

清华大学官网视频截图:清华大学校长王希勤(左)、唐杰(中)、中国工程院院士、清华大学人工智能研究院院长张尧学(右)

在这场成立仪式上,智谱AI的CEO张鹏也出席并致辞,他的发言就在唐杰介绍研究中心的发展规划之后。另外两位致辞的人分别是清华大学智库中心的主任和计算机系主任。

值得注意的是,研究中心的两位副主任都是来自计算机系的教授,分别是黄民烈和刘知远,而就在9月,同智谱B-4轮融资消息一同传出的是智谱全资收购了另一家大模型公司聆心智能——它的创立者正是黄民烈。

事实上,尽管是一家初创公司,但智谱在大模型领域出手的次数并不少,聆心智能的天使轮和Pre-A轮智谱都有参与,而智谱还曾投资过另一家清华系的大模型公司的种子轮和天使轮——面壁智能,而它的联合创始人正是基础模型研究中心的另一位副主任刘知远。

有关对聆心智能的全资收购随后被证明不准确,但毋庸置疑的是双方正在进行紧密的合作。这可能与聆心智能自身在通用大模型性能上进展不顺利有关,聆心智能一直在试图打造中国版的CharacterAI,也就是帮助用户创建和定制AI角色并进行对话,去年聆心智能的首个产品“AI乌托邦”基于自研中文对话大模型OPD,但今年,AI乌托邦悄然改名为AiU社区,背后的大模型也变为了名叫CharacterGLM的超拟模型,从这个名字我们就能看出,它是由聆心智能联合智谱合作打造的,本质上还是基于GLM-130B模型能力。

从上面的例子中我们看到了大模型赛道上的整合趋势。特别是资本整合背后意味着的是技术上的整合,每个参与百模大战的人都需要证明自己的真正实力,在这一点上,初创公司和巨头之间并不存在本质性差异。

过去的一种比较普遍的观点是,大模型在技术上并不存在绝对的瓶颈,卡脖子的领域主要集中在算力领域。这种略显简单的观点实际上是在说,得算力者得天下,而技术能力和人才储备的重要性被选择性的忽视了。

智谱的例子很好反驳了这一点,无论是针对单卡算力还是国产GPU,智谱的模型都有很好的适配性,最终这导致了成本的大幅度下降,背后依靠的还是技术积累与工程能力上的突破——大厂在这方面并不格外占优,也就是说,胜利的天平最终会向技术领先的那一方倾斜,而智谱也许是这场比赛最终留在牌桌上的几位玩家之一。

11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!

今天是中秋国庆假期第4天,假期已过半。双节假期第4天,你在干什么?景区观光、都市休闲、乡村旅游、探亲访友等热度明显升高。

AI这一波热潮,我们接触到更多的其实是面向B端的应用,例如废料处理、例如医疗、甚至养殖产业,都有创业者做效率的提升。面向C端的应用落地,却始终局限在几个方向上。未来还有没有新的玩家入局,又会用怎样的方式在什么领域切入市场呢?我们会持续关注。

清华大学与智谱AI合作开发的CogVLM-17B是一款国产多模态模型,具有卓越的性能。该模型不仅可以识别图像中的对象能分辨完整可见和部分可见的物体。其深度融合方法的创新性标志着多模态模型训练范式的改变,为未来的研究和应用提供了新的思路和可能性。

看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。不过目前仅支持英文,后续会提供中英双语版本支持,可以持续关注。

OpenAI已经悄悄地更改了其在公司招聘页面上的核心价值观。互联网档案馆于9月25日的页面快照显示,OpenAI公司最初的核心价值观包括「大胆」、「深思熟虑」、「谦逊」、「重视影响」、「团队合作」和「注重成长」等特质。今年1月,微软确认将向这家AI公司再投资100亿美元。

苹果CEO库克日前表示,公司计划在英国招募更多员工从事人工智能工作。苹果正在积极研究生成AI技术,并表示公司在英国和AI领域的投资将会增加。这款框架基于Google的Jax机器学习框架构建,苹果曾考虑与OpenAI签订合同,并尝试使用OpenAI的技术,但最终放弃了这个计划。

OpenAI刚刚宣布,他们现在接受申请参加他们的第一个开发者大会。DevDay计划于2023年11月6日在旧金山举行,您可以点此申请。但如果您正在积极开发生成式AI应用程序,分组会议和与OpenAI工程师的交流可能非常有价值。

图源备注:图片由AI生成,图片授权服务商Midjourney新一代个人AI助理之战,终于打响了。9月,三家公司发布了重要预告,标志着这个节点的到来。究竟会是谁赢下这场战争呢?亦或是像上一代语音助手之战一样,轰轰烈烈之后没有赢家。

美国人工智能公司OpenAI,即ChatGPT背后的公司,于近日宣布计划在欧洲内设立办公室,选址在爱尔兰的都柏林。这标志着OpenAI在欧洲的首个基地,显示了公司对欧洲市场的增长兴趣。”OpenAI的扩张计划显示了人工智能领域在全球范围内的持续增长和竞争,公司希望通过设立办公室在欧洲和印度尼西亚进一步加强其全球影响力。

法国亿万富翁XavierNiel正在向人工智能领域投资2亿欧元,主要用于在巴黎建立一个未来研究实验室、利用英伟达公司硬件提供云超级计算能力,以及为初创企业提供资金。Niel在接受采访时说,这项努力旨在吸引法国顶尖的人工智能工程师回到祖国,在那里他们可以打造人工智能产品,与OpenAI等公司竞争。这是一个主权问题:为了保护我们的数据,我们需要在我们的领土上建立�

Startup Pitch Deck Generator是一款由AI助手驱动的创业路演文稿生成工具。它可以协助用户制作结构良好的创业路演文稿。该产品具有以下优势:1. 通过AI助手的智能分析和建议,帮助用户打造出具有吸引力和说服力的创业路演文稿;2. 提供多种模板和设计选项,使用户能够根据自己的需求进行个性化定制;3. 提供实时协作功能,多人同时编辑和评论,方便团队合作;4. 提供导出和分享功能,方便用户与他人共享和展示创业路演文稿。该产品的定价为每月10美元,适用于初创企业和创业者。

ZeroBot是互联网上最好的语音聊天机器人。想象一下与一个像真人一样与你交谈的计算机朋友进行对话。与ZeroBot一起,不仅仅是打字 – 还可以说话!准备好以全新的方式聊天吧。 主要功能点: – 在任何时间、任何地点创建和与AI代理人交谈 – 提供导师、咨询师、伙伴和医生等不同角色 ZeroBot在媒体上的影响

Zero123++是一个单图生成多视角一致性扩散基础模型。它可以从单个输入图像生成多视角图像,具有稳定的扩散VAE。您可以使用它来生成具有灰色背景的不透明图像。您还可以使用它来运行深度ControlNet。模型和源代码均可在官方网站上获得。

TTime是一款简洁、高效、高颜值的输入、截图、划词翻译软件。它提供了输入翻译、截图翻译、划词翻译等功能。用户可以通过快捷键调出翻译窗口,自行输入翻译;也可以通过快捷键调出截图,软件会自动识别并翻译图片;还可以对光标已选中的文字进行划词翻译。TTime支持离线词典、隐藏翻译窗口输入框、翻译结果复制驼峰、下划线等功能。它还提供了多种OCR源、自动翻译模式、翻译记录功能等。TTime适用于Windows和Mac系统。

ZBots™ 是定制训练的对话式聊天机器人。它们通过使用您自己网站的数据进行训练,确保与您的品牌声音、产品细节和业务理念相一致。ZBots™ 能够以对话的方式与访客进行互动,回答问题,引导他们进行购买,并在24/7全天候在线提供服务。ZBots™ 的安装简便,只需一行代码即可集成到您的网站中。

ProductScope是一个由AI驱动的平台,为亚马逊工具提供聊天助手和分析功能,旨在增强和优化您的亚马逊业务。使用ProductScope的ChatGPT for Amazon工具,您可以深入了解产品评论、优化产品列表、生成AI产品图片等。它还提供智能关键字研究、客户意图分析、情感分析等功能,以帮助您制定更有效的营销策略。产品定价灵活多样,可根据您的需求选择适合的计划。

Eagle Bot是一款集浏览器、聊天机器人和自动化软件于一体的创新产品。它基于先进的自然语言处理、计算机视觉和AI驱动的机器人流程自动化引擎,将您的指令转化为动作,为您提供无缝集成的定制浏览器,大大提升您的浏览和自动化体验。它具备强大的搜索功能、独特的对话体验、创造性的可视内容生成、跨平台的自动化等特点。

AI Chats是一款基于AI驱动的聊天应用,通过个性化的聊天机器人为用户提供符合其兴趣和偏好的互动聊天体验。我们的应用支持多领域的对话话题,使交互更加流畅和有机。用户可以快速个性化设置并开始与AI聊天,而且完全免费使用。聊天机器人会根据用户的互动学习和进化,帮助用户探索未来的人机交互方式。

WisBot是一个在Jupyter Notebook中与数据交互的AI助手。它可以识别当前的Notebook,理解所有的代码和数据,并执行从探索性数据分析到高级机器学习建模的任务。WisBot可以回答有关代码和数据的任何问题,执行代码并自动化任务。通过WisBot,您可以在Jupyter Notebook中学习Python和数据科学,并获得个人助手的支持。注册并解锁免费试用。

Prompt Grip是一个惊人的Prompt工具,它提供了一个巨大的Prompt库,可以帮助用户生成各种创意作品。它具有丰富的功能和优势,支持多种艺术风格和媒体形态的创作。定价灵活合理,定位为帮助用户提升创意和艺术效果的工具。

Macar AI是一款自动化求职信撰写系统,使用人工智能为您撰写求职信。该系统使用HTMX、JavaScript、Plain Old CSS和Pico CSS进行前端开发,后端使用Django。它能够根据您的过去经验和项目,生成个性化的求职信。不论您是在寻找梦想工作还是想要给自由职业者留下深刻印象,我们的工具都能满足您的需求。

Hackules是一个帮助企业进行数字化建设和增长的软件开发、网站开发、设计和数字营销服务提供商。我们使用自动化和人工智能来加快软件开发的速度,减少成本。通过引入AI和自动化,我们可以在更短的时间和更少的预算内构建相同的产品。您可以节省25%的时间和资金,并且我们不断努力提高这个百分比。

Toogi AI是一款先进的内容创作平台,包括文字、图片和语音等高质量内容生成工具。它能够帮助用户轻松生成引人入胜的文章、博客、社交媒体更新,并提供优质的图像和语音合成功能。Toogi AI提供多种功能,包括智能写作、图像生成、语音合成、转录等,帮助用户提高生产效率并节省时间。Toogi AI的定价灵活,并提供免费试用。

Video Prompt AI是一款使用人工智能生成视频的工具。它能够根据您提供的提示或脚本,快速生成令人惊叹的视频编译。通过使用AI生成的图像,它能够帮助您以更短的时间制作视频,吸引您的观众。Video Prompt AI还提供AI生成的艺术,让您能够以引人入胜的方式表达您的信息。无论是创作故事情节,还是根据语音生成视频,Video Prompt AI都能帮助您轻松地创建令人印象深刻的视频。

AI-Powered Spreadsheet and Document Assistant是一款基于人工智能的助手工具,可帮助用户创建、编辑、格式化表格和文档,生成图表,并提供内容翻译功能。它能够提升工作流程的效率。

AI段落生成器是一款利用人工智能技术,能够自动生成、重写和改写段落的工具。无论是写作、博客、学术论文、市场营销还是其他领域的内容创作,都能够轻松地生成有深度、有信息量的段落。它支持多种写作风格和语言,并能根据需要优化内容,提升搜索引擎排名。AI段落生成器能够广泛应用于各种场景,帮助用户节省时间和精力,提高内容质量和效率。

Mentis是一款旨在提升LinkedIn个人资料影响力的终极Web应用。它提供了一套强大的工具,帮助用户生成引人注目的内容创意和有影响力的帖子。无需麻烦的复制粘贴,您可以轻松地使用Mentis直接在LinkedIn上发布内容。Mentis正在不断完善和更新功能,力争成为市场上最好的LinkedIn内容工具。

helpix AI是一款智能客服自动化工具,能够即时响应客户查询,轻松提高效率。通过无缝集成多渠道信息、持续学习优化、深度理解自然语言等功能,helpix AI提供卓越的客户服务体验。具体定价和功能详情请参考官方网站。

FactBox AI是一个可轻松创建、共享和管理综合事实表的平台。它提供丰富的模板库和直观的拖放界面,让您可以自定义布局并展示有效的信息。您可以轻松上传CSV数据,利用自定义和高级小部件增强事实表。通过生成公共URL,您可以方便地分享事实表。同时,您可以一键导出事实表为PDF格式,便于离线访问和打印。

发表评论

邮箱地址不会被公开。 必填项已用*标注