2024年9月20日

知名3D扫描应用企业Polycam在官网宣布,结束对3D GAUSSIAN SPLATS(以下简称“3DGS”)的测试,正式投入商业使用。

3DGS是一款通过图片或视频,就能直接生成3D高斯分布的生成式AI产品。通过插件还能将生成的产品导入到Unity、 Unreal等游戏开发引擎中使用、二次编辑,这对于3D设计师、房地产经纪、博物馆展示、医疗研究、电商展示等帮助巨大。

目前,3DGS处于免费在线体验状态,不锁区直接访问。如果你想使用更高级的功能,例如,一次性上传1000张图片、15分钟超长视频就需要付费。对于普通人来说,免费功能就足够了。

3D 高斯分布用于体积渲染、可视化和图像处理领域。该技术主要将一系列的样本点、粒子、数据点映射到一个三维网格上,并通过使用高斯函数来调制这些点,以此来生成平滑的、连续的三维数据图像。

简单来说,就是用2D平面来生成,可拖动、展示的3D度图像。该技术在气象、医学、金融等领域应用非常多,主要用于3D度展示。

传统上开发3D高斯分布需要专业的技术背景以及耗费大量的时间,而3DGS极大简化了这一流程,用户只需要上传图片或者视频就能直接生成。

2)点击“Choose from filesystem”开始上传文件。免费版最多可上传200张图片或3分钟视频,如果有更多需求可开通Pro付费。

3)上传完图片后,点击“Upload & Process”就可以开始制作了,如果你需要对图片进行排序,可以点击“Sequential”按钮。

起初「AIGC开放社区」在体验的时候出现了不少错误生成效果不理想,后来发现上传的图片还是有一些技巧的。

1)上传的图片需要动作连续,不能杂乱无章,例如,我们要生成一个房子展示的3D高斯,需要按照顺时针或者逆时针,有顺序的拍摄尽量保持50%的图片重叠,这样3DGS的生成的效果更逼真。

简单来说,可以把3DGS当成是一个连环画生成器,所以,你上传的素材之间一定要有关联,方便神经网络进行识别。

2)多角度拍摄,可以先拍近景、然后再拍远景,尽量多角度的去拍摄,这样呈现的效果也更加多元化。

3DGS的核心技术是一种光栅化技术,使用了大量高斯函数而不是传统的三角形来表示场景。这些高斯函数包括位置、变形、颜色等参数。

3DGS还使用了结构从运动算法从图像中恢复点云。然后将点云转换为高斯函数。然后,利用可微分高斯光栅化,通过类似神经网络的随机梯度下降进行训练,优化高斯函数的参数。

在训练过程中,3DG使用自动稠密和剪枝来调节高斯函数的分布,以更好地适应细节。最终,经过训练的高斯函数可用于实时快速光栅化生成逼真图像。

相比之前的实时渲染技术,3DGS生成的图像质量大幅提升,完全可达到静态渲染的照片级逼线DGS的渲染速度非常快,如果图片质量、视频比较小,完全能够做到实时交互。

在三星人工智能论坛2023上,三星正式公布了其自研的生成式AI模型Gauss。三星AI模型的名字来源于德国数学家高斯,他是创立正态分布理论的传奇数学家这一理论也支撑着机器学习和人工智能的发展。三星还宣布,GalaxyAI将会用在新的Galaxy旗舰手机上,也就是后面要发布的GalaxyS24系列,另外该项功能不仅仅是海外版,国行版的GalaxyS24系列也会支持。

北京智源AI研究院、牛津大学、澳大利亚国立大合发布了一项研究—3D-GPT,通过文本问答方式就能创建高精准3D模型。3D-GPT使用了大语言模型的多任务推理能力,通过任务调度代理、概念化代理和建模代理三大模块,简化了3D建模的开发流程实现技术化。在多步语言指令的场景中,3D-GPT能够充分理解每一步指令,并对场景进行准确修改。

【新智元导读】最近,来自澳国立、牛津和智源的研究人员提出了一个由LLM驱动,用文字提示就能生成复杂3D场景的智能体框架。无所不能的大模型线D世界了吗?继火爆全网的AI文生图,文生视频之后,文生3D场景的技术也来了!‍只要不到30个字的提示词,瞬间就能生成这样的3D场景。这些结果表明,研究人员的方法可以有效地使用单一函数以及推断相应的参数。

Audioread是一款利用人工智能将文字转换为语音的工具。其具备超逼真的文本转语音引擎,能够以自然而专业的叙述风格朗读任何文本,旨在长时间收听,训练有素,几乎无法与真实有声书叙述者区分开来。用户可以使用网页应用、浏览器插件、iOS快捷方式或Android应用程序将文字转换为音频,也可以转发电子邮件、拖放PDF、复制/粘贴文本或者高亮文本。Audioread还支持创建并订阅私人播客,用户可以在任何播客应用程序中订阅私人播客,如Apple Podcasts、Google Podcasts、Spotify等。此外,用户还可以在浏览器中收听,无需安装任何应用。Audioread还提供付费服务,包括月度订阅,每月9.99美元,每次转换最多10万字,每日最多50万字,支持77种语言。

Eilla AI是一款AI平台,利用高质量行业专业人士的智慧,自动化繁琐任务并支持复杂决策。它可以帮助用户优化并购、风投和私募股权交易流程,提高工作效率。

Pet-Knowing利用AI技术,帮助用户识别宠物品种和情感。用户可上传宠物照片,通过图像和音频数据,系统将识别出宠物的品种和情感。产品准确度高,数据安全可靠。定位为宠物爱好者和养宠人士的便捷工具。

FTChatAI是一款人工智能聊天机器人,采用最新的自然语言处理技术,能够进行智能而有趣的对话。无论您想要写长篇内容(如文章或邮件)、讨论时事、分享想法和感受,还是随意聊天,FTChatAI都能倾听并与您互动。凭借其不断发展的人工智能技术,FTChatAI能够理解并回应各种话题和主题,帮助您解决工作和个人生活中的各种问题。

Smexy AI是最简单、最快速、最好的平台,用于生成和分享您的幻想。无需GPU或强大的计算机,只需输入您的提示并开始生成。与其他网站不同,我们提供具有无限提示选项的最高质量模型。通过我们简化的提示工具,您可以轻松进行任何调整以满足您的精确需求。定价请参考官方网站。定位于为用户提供快速、高质量的幻想生成和分享平台。

EnglishXYZ是一款专为英语学习者设计的插件,提供双语字幕、快捷查词和收藏等功能,让用户将YouTube打造成专属的英语学习教室。插件还具备强大的查词功能,支持快速显示释义、详细信息查阅以及单词收藏。同时,后台系统能记录用户收藏的所有单词,方便随时复习。EnglishXYZ定位于帮助用户在观看视频的同时轻松学习英语。

Fridgtain: Grocery Genius是一款厨房管理APP,通过创建数字版冰箱,添加食材,设置保质期,提供清单、库存、过期提醒等功能,帮助用户更好地管理食材,避免浪费。升级到Fridgtain PRO版本,用户可以享受AI扫描等高级功能,支持多个数字版冰箱,适合更大的家庭使用。该产品定位于家庭用户,价格免费,PRO版本年费44.99欧元,月费3.99欧元。

Stylefie AI是一款利用人工智能技术,能够从用户上传的照片中生成多种独特头像风格的产品。用户只需上传照片,即可在几秒钟内享受到超过20种独特的头像风格,为用户的照片增添创意和个性。产品定位于个人用户,提供简单易用的头像风格生成服务。

Roast My Room是一款AI室内设计评估工具,用户可以上传房间图片,获取AI评估和室内设计建议。它可帮助室内设计师、房地产经纪人、DIY爱好者和家具商店提供实时设计选择、展示潜在房屋潜力、节省时间和提高销售额。

Roast your email是一款基于GPT-4 Vision的产品,通过上传邮件截图,可以获取对邮件的调侃和嘲讽。它能够帮助用户在轻松的氛围中检查邮件内容,提供一些有趣的建议和评论。产品定位于提供娱乐和轻松的体验。

GiftGPT是一款基于个性化算法的礼物推荐平台。我们的独特算法根据收礼人的兴趣、年龄和关系量身定制礼物想法,确保您每次都能找到完美的礼物。我们的专家团队精心挑选来自信任来源的高质量礼物,让您可以从市场上最佳的选择中挑选。无论您是在寻找贴心的生日礼物还是豪华的周年纪念惊喜,我们都有适合各种预算和场合的礼物想法。

promo.ai是一款强大的邮件通讯生成工具,能够将您的最新内容转化为令人惊叹的每周/每月通讯。它能够跟踪您的最佳内容,使用智能算法选择最佳内容并在您需要时生成通讯。该产品提供自动设计、品牌定制、无需编码、集成分析等功能,同时提供透明的定价方案。适用于不同规模的邮件通讯需求,并提供高效的客户支持。

ArtSpace.ai是一款强大的图像助手,结合了人工智能的创造力与艺术灵感,能够帮助用户轻松绘制美丽的图像和设计作品。其功能包括无限画布、替换和填充功能,支持生成高分辨率图像,且不设水印,可商业使用。价格为一次性支付297美元的终身许可。ArtSpace.ai旨在激发用户的创造力,提供14天无条件退款保障。

Сhatterbox one是一款AI聊天工具,专为OnlyFans和Fansly平台设计,能够大幅提高与粉丝的聊天互动速度。通过智能AI技术,帮助用户在与多名粉丝同时聊天时更快地回复消息,提高与免费粉丝转化为付费粉丝的比例。同时,产品定价灵活,提供免费试用和不同套餐选择,满足用户不同需求。智能机器人支持英语和俄语,用户可通过官方网站或Chrome插件进行试用和购买。

Talk to PDF是一个在线文档朗读工具。它可以自动将PDF、PPT、Word等文档中的文字转成语音朗读出来,使阅读体验更加便捷、有趣。用户只需上传文档,Talk to PDF就可以生成语音版本,支持可调节语速、自动滚屏等功能。适合需要大量阅读文档的用户,如学生、老师、白领等。

Stilo是一款AI 助力的日记应用,通过智慧和建议加速个人成长。它会随着时间了解您,解锁其他工具无法匹敌的见解。Stilo不再只是一个基本的思想存储库,它连接各种信息,每天呈现有用的见解。高绩效者需要的不仅仅是显而易见的通用建议。在您写作的过程中,Stilo会推荐书籍、播客节目和深刻的引言,帮助您深入挖掘。

OmniDock是专为Facebook、Circle.so和Slack打造的,基于人工智能技术的私人社区潜在客户管理工具。用户可以监控社区动态,第一时间与潜在客户互动,轻松安排发布内容,并授权团队成员进行监控、发布和互动。产品定位于帮助用户在私人社区中发现潜在客户,并提供多种付费和免费服务。

Thunderflow将GPT的力量带到您的计算机和所有应用程序,只需点击快捷方式即可。它能在不切换上下文的情况下直接通过Thunderflow操作来自任何应用程序的所有文本。您可以通过简单的快捷键激活快速操作面板,无需打断工作流程即可在选定的文本上快速运行预定义或自定义操作。将您的文本立即转换为任何地方,无缝集成到您的桌面。可实时查看Thunderflow将输出流直接注入任何文本字段或编辑器,与任务无缝融合。选择多个模型,根据预定义操作的复杂性或需求。定义输出样式,控制生成文本的最终外观。现已支持Windows和Mac,Linux支持即将推出。

Labescape Prompt生成器可以帮助用户生成高级的AI prompt,提高AI的使用效率。该产品提供了针对ChatGPT、Midjourney和Dall-E的专业化prompt生成功能,用户可以快速获取适合不同场景的高质量prompt。该产品还提供了每月10次免费的prompt生成额度。

Screenshot2Code是一款利用新的GPT-Vision API技术,可以将截图中的代码自动识别并转换为实际可运行的代码,极大提高开发效率。该产品定位于提升开发者的生产力,定价灵活,根据月度使用量收费。

发表评论

邮箱地址不会被公开。 必填项已用*标注