2024年9月20日

经过 Int4量化,AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗,提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合,通过4位量化和 Low Rank Adapters (LoRA) 方法进行微调,从而实现在不损失模型性能的情况下节省内存和提高训练速度。

据悉,Aquila2-34B 系列模型已经在国产芯片上进行了适配,并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术,用户可以在低资源环境中运行大参数模型。

查看更多相关信息

智源研究院发布了最强开源中英双语大模型——悟道・天鹰340亿。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。智源研究院还发布了FlagScale高效并行训练框架和FlagAttention高性能Attention算子集,进一步推动大模型研究的发展。

百度发布的文心大模型4.0在“百度世界2023”上吸引了大量关注。与前几代版本相比,4.0版在许多技术领域都有了显著的进步。百度文心大模型4.0版本官网地址入口百度文心大模型4.0的发布和开放测试是人工智能领域的一个重要突破,这款产品的多样化和智能化特性将有助于推动人工智能在多个领域的应用和发展。

OpenAI发布了文生图模型DALL・E3,生成效果非常惊艳。你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上:可以看到,DALL・E3不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了出来。种子轮领投方清智资本合伙人张煜表示:目前,光影焕像在3D基础模型方向的工作正在稳步推进,我们期待他们早日实现下一个突破。

vivo推出自研通用大模型矩阵——蓝心大模型,包含十亿、百亿、千亿三个参数量级共5款。蓝心大模型7B和1B支持高通和联发科双平台,是面向端侧的大模型;70B、130B和175B则是面向云端服务和复杂逻辑推理等应用场景的大模型。蓝心千询将上架各大手机应用市场,所有手机用户都可以下载使用,体验AI的乐趣。

Tweet Trends是一个帮助用户使用人工智能生成与当前趋势话题相关的病毒式推文的工具。它可以帮助您轻松撰写吸引人的推文,快速发现趋势话题,并提高推文的产出效率。通过使用Tweet Trends,您可以与粉丝更好地互动,并为您的推文增加影响力。我们提供简单而实惠的定价,以及多种声音可供选择,允许编辑和发布推文。

Feedback Sync是一个基于人工智能的Slack应用,将客户反馈同步到一个地方,供整个组织共享、参考和分析。它可以帮助识别趋势,并提前预防客户流失。安装Feedback Sync可以降低客户流失率,提高利润率。平均每家公司每年流失10%的客户,而降低5%的客户流失率可以增加25%至85%的利润,具体取决于行业。

Trademarkability是一个商标搜索和申请一体化平台,旨在为个人和企业保护品牌和知识产权提供快速简便的解决方案。我们的团队由具有多年注册经验的商标专业人员组成,了解到对于第一次进行注册的人来说,注册可能是一个困难的过程。即使您之前已经申请过商标,使用Trademarkability也是一个快速简便的解决方案,可以简化流程。

AI Pixar Posters是一款能够以Pixar风格生成海报的AI工具。它具有易于使用、价格合理的优点。用户可以通过输入关键词来生成Pixar风格的海报,并可以自定义和分享海报。该工具适用于所有技能水平的用户,既可以用于娱乐,也可以用于商业用途。AI Pixar Posters免费使用,通过Bing Image Creator和DALL·E 3提供支持。

Vairflow是一个AI驱动的下一代云服务IDE。它可以帮助您更快地构建、更多地构建。它简化了复杂的想法,将其转化为组件,每个组件可以是后端微服务(如Flask、FastAPI等)、Web UI(如React、Next.js、Vue.js等)或移动应用UI(适用于Android、iOS)。您可以无缝地开发和部署组件,消除了本地环境设置的麻烦,并可以通过单击一次部署。Vairflow还提供了AI辅助功能,如代码生成、代码完成、代码解释等,以及实时预览编辑的功能。您可以根据实际使用情况付费,并可以无缝切换项目和环境。Vairflow的定位是灵活部署、成本有效、无缝协作,无供应商锁定。

发表评论

邮箱地址不会被公开。 必填项已用*标注