随着ChatGPT的一波又一波高潮,生成式AI逐渐进入人们视野,并开始大行其道,正如人们所说:AI用的好,天天下班早!
当然,有效的利用AI不但能下班早,还能在上班时间摸鱼,就如潘哥我,哈哈哈~~~
牛X的AI神器可以不止ChatGPT一款,虽然潘哥对ChatGPT情有独钟。今天就给大家推荐54款AI神器,有了它们,让你的工作效率再次提升N多倍!
01
聊天/写作类工具
ClaudeClaude是人工智能初创公司Anthropic 发布的一款类似ChatGPT的产品。
Claude是一个高度智能的人工智能助手。它可以通过自然语言理解您的意图并开展各种交互,从而成为您生活工作中的最高效AI伙伴,让繁琐的任务与复杂的信息处理变得简单高效。
很多AIGC爱好者,也经常拿来Claude和ChatGPT做对比。他们中的很多人认为,ChatGPT在语言表达和生成上更胜一筹,是目前公开的性能最强聊天机器人。但Claude作为一款商业产品,在安全性、长期记忆和交互体验上更加成熟,适合实际商业应用。如果是从研究与技术视角,ChatGPT可能更具优势。但从产品与应用角度,Claude会更加实用和成熟。两者均是目前最先进的聊天机器人,都值得学习与参考。
7月12日,Anthropic 宣布,发布最新大语言模型Claude 2。
升级后的Claude 2 模型在编码、数学和推理方面的性能都有所提高。升级之后,Claude 2的处理能力已经提升到了100K个Token,这意味着它可以处理数百页(8万字左右哦)的技术文档,甚至是整本书。此外,Claude 2 也开始面向更广泛的用户群体免费开放,并支持中文使用。
官网地址:https://claude.ai
谷歌Bard Bard是搜索引擎世界第一的巨头谷歌(Google)硬刚ChatGPT的大杀器。
Bard是谷歌在一个大型语言模型基础上,推出的聊天机器人。Bard背后的力量是Google的对话应用语言模型,又名LaMDA。Bard是基于LaMDA的轻量级版本。 在AIGC领域,谷歌应该是起了个大早,赶了个晚集。因为AIGC最底层的框架是谷歌最早研发的,但谷歌却没有早于OpenAI推出AIGC,是不想自我革命,还是其它原因不得而知。网传,谷歌早期研究AIGC的都跳槽去了OpenAI,而近期又有报道说,这些人又开始回流到谷歌了。
7月13日,谷歌Bard迎来史上最大幅度升级:中文、识图、存档导出能力都来了。
简单来说,Bard 现在包含了更多种语言知识,可以提供更细致的响应控制,除了严肃的文本之外还可以用口语进行响应。在实际使用过程中,你还能看到它不再总是一句话回答问题了。
官网地址:http://bard.google.com
文心一言 百度旗下文心一言:能够像当初抗衡Google一样抗衡ChatGPT?当然,一定不要有广告,也不能谁给钱了,就回复谁的内容哈~~~
文心一言(英文名:ERNIE Bot)是百度开发的一款聊天机器人,文心一言云服务将于3月27日上线。6月,百度文心大模型3.5版本已内测可用。
不用说,百度对标谷歌的话,文心一言对标的一定是ChatGPT了。百度在互联网时代,在谷歌退出中国后,曾经叱咤风云。当然,也饱受“广告”诟病。
移动互联网时代,百度没有抢到“船票”,默默于无人驾驶技术,但受多重因素影响,该技术还没有给百度带来更大收益。
百度的陆奇时代,由于陆奇希望All in AI,被离职了。这次百度携“文心一言”回归,在冰火两重天的评论中,不知能否再现辉煌。
官网地址:https://yiyan.baidu.com/
通义千问 通义千问是阿里云推出的一个自主研发的超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。4月18日,钉钉正式接入阿里巴巴“通义千问”大模型。
阿里自带的是电商的基因,通义千问会不会重点针对商业应用?潘哥认为是很有可能的。
在淘宝系市场份额屡屡下滑的当下,又逢蚂蚁金服再次被重罚,阿里重构了企业组织模型和人事任用,不知道是否能够通过通义千问挽回颓势。
官网地址:https://tongyi.aliyun.com/
Notion Al Notion AI,一款 AI 加持的在线文档编辑和管理工具,人工智能写作工具之一,聚焦于内容创作领域,依托其效率便捷、多领域适用、操作简单等特点而闻名于世。被誉为是文档领域的ChatGPT。
Notion AI支持中文、英文、日文等多国语言和多人协作,并提供了丰富的模板和插件,被广泛应用于笔记、知识库、新闻编辑、项目管理、会议记录、日程等多种场景。
Notion AI是由位于硅谷的生产力独角兽Notion开发的一项人工智能服务。最初的发布仅限于一小部分用户,他们能够预先注册使用该服务。然而,在最近几个月,随着越来越多的用户获得了使用该人工智能服务的权限,一股热情横扫用户社区,许多用户称其为“强大的生产力工具”和“提高效率的利器”。
Notion A提供了一系列A驱动的功能,包括头脑风暴、写博客、创建大纲、管理社交媒体、写学术论文和总结研究。
Notion Al可以从Notion应用程序内访问,当创建新文档或按住空格键时,A助手会自动弹出。然后,助手会呈现一人下拉菜单,其中有超过十个选项,涵盖各种写作任务,每个选项都提供不同的写作风格、模板、语气和扩展功能。
官网地址:https://www.notion.so/product/ai
讯飞星火 讯飞星火是科大讯飞在5月6日推出的一自主研发的(自从OpenAI开源后,所有新起的大模型都这么说,原谅潘哥,阴暗了~~~)一款大语言模型,具备文本生成、语言理解、知识问答、逻辑推理、数学、代码、多模态这七大维度能力,经测评对比发现,讯飞星火在语言理解和数学能力上的表现已经优于ChatGPT。
讯飞星火可以完成多风格、多语言、多任务的长文本生成,还能对英文文案进行语法检测和纠错,在语言理解能力上不输国内可测的现有系统。
当年,百度推出的宣传口号是:“百度,更懂中文”,直接打击谷歌。讯飞星火不知道是不是这个意思,讯飞星火更懂中文?尤其是古文?
官网地址:https://xinghuo.xfyun.cn/
序列猴子 序列猴子是AI公司【出门问问】推出的大语言模型。序列猴子大模型是具有长序列、多模态、单模型、大数据等特点的超大规模语言模型,基于其通用的表示与推理能力,支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。
序列猴子创始人是【李志飞】,美国约翰霍普金斯大学计算机系博士,前Google总部科学家,世界级自然语言处理及人工智能专家,世界主流机器翻译开源软件Joshua主要开发者。
官网地址:https://openapi.mobvoi.com/index
02
/
图像生成类工具
图像生成类AIGC工具,一般分为三大类:
一、图像生成 以Midjourney、Stable Diffusion、DALL-E 2等为代表的AIGC产品,主要功能为逼真的图像生成,这类图像生成工具,能够基于一段文本描述(我们也称之为指令/prompt)或是草图,就能生成一张具有指定风格的完整图像,这类工具有逻辑明确的底层技术,能为图像创作者提供非常好的创意灵感来源,并作为创作的重要参考。
二、图像编辑 主要功能就是图片处理类,比如图片智能去水印、设置风格滤镜、修改图像风格或是提升图片清晰度等等,以Imagen AI、创客贴AI画匠等产品为代表。
三、图像局部修改 顾名思义,对图片进行局部编辑修改的工具,代表产品为Adobe Firefly。它的主要优势聚焦于更改图像的部分要素,或是按照图层来逐层修改调整,适合于二次创作或是后期的作品完善环节。
口袋妖怪
Midjourney 以文生图,视觉效果炸裂,最近一段时间短视频刷屏主力军,AI绘画界聊天机器人的扛把子,工具搭载在Discord上。Midjourney V5版本推出后,更是让人赞叹。在图像的逼真度、细节处理上更加精细,商业化水准更高,近乎达到了摄影级别、可以“以假乱真”的地步,当然,Midjourney的爆火就是源于一组足以以假乱真的情侣图片。
Midjourney已经让很多普通的设计师开始失业,更是在商业领域尤其是产品开发里,大放异彩。
官网地址:https://www.midjourney.com/
Stable Diffusion Stable Diffusion是一款免费、开源的AI图像生成器,具有像素级图像生成效果,与Midjourney也是一时瑜亮。
用户只需使用较短的描述性指令(提示词/prompt)就能生成图像,图像的人体结构、细节处理也更符合现实、更符合大众审美,生成的肖像图也更加清晰逼真。
炸裂效果的背后,是较高的使用门槛。
官网地址:https://stablediffusionweb.com/
Disco Diffusion Disco Diffusion是一个运行在谷歌云端电脑(Google Colab)上的作图程序,拥有谷歌账号的用户可以直接在浏览器上运行。也可以部署到本地运行,但需要用户掌握一定的代码知识。
用户通过输入一段描述语句,该程序就能自动渲染生成对应场景的图片,它更擅长生成风格偏梦境感的抽象画面,在写实风格的具象生成和输入较多文本描述时效果一般。
官网地址: https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
DALL-E 2 DALL-E 2是OpenAI公司推出的一款图像生成与编辑工具,也是一款神作,以其牛B的生成效果和艺术色彩而著称,被誉为现实主义绘画大师。用户只需输入简短的指令(提示词/prompt),DALL-E 2就能综合概念、属性和风格三个要素,给用户生成出一张符合需求的现实主义图像,同时还能具备不同艺术家的绘画风格。
比如,用户输入概念“一支松鼠”、属性“在树上”和风格“波普艺术家安迪·沃霍尔风格”三个要素,DALL-E 2就能生出符合这三个条件的图片,而且效果非常卓绝。该工具的功能还包括图像编辑、风格变体等。
官网地址:https://openai.com/product/dall-e-2
Adobe Firefly 说到图片生成,怎么能少得了Adobe公司呢?毕竟它旗下的Photoshop可是当下全球图像处理界当之无愧的翘楚啊。
Adobe联合芯片巨头英伟达推出的Firefly,可以完美的完成“AI作图+修图”。目前已实现文本生成图片、草图转换成画面、一键修改画面内容等功能,还可以对自动生成的图片进行分层修改,输出超高分辨率的图像。
熟练掌握Photoshop的小伙伴,可以尝试一下哦~~~
官网地址:https://www.adobe.com/sensei/generative-ai/firefly.html
文心一格 百度AI全家桶之图像生成工具,支持以图生图、图转视频。
文心一格依托于飞桨、文心大模型技术,使用者只需输入自己的创意文字,并选择好期望的图片风格,文心一格就能生成的画作,还可以自行选择画面类型、图片比例、单次生成的图片数量等。目前,文心一格已支持如油画、水彩、动漫、写实等十余种不同风格图像。
当然,也曾网传文心一格是先把指令翻译成英文,再去xxx,然后再去生成图片。
官网地址:https://yige.baidu.com/
阿里鹿班Luban 鹿班是由阿里巴巴集团智能设计实验室【自主研发】的一款图像生成工具。基于AI图像生成技术,鹿班可以在短时间内完成大量Banner图、海报图和会场图的设计。
应该看明白了吧!是的,鹿班有点像是专为电商而生。使用者只需输入想达成的风格、尺寸,鹿班就能很快完成素材分析、抠图、配色等耗时耗力的设计项目,实时生成多套符合要求的设计解决方案。普通的美工,基本就被干翻了。
官网地址:https://luban.aliyun.com/
03
/
音频生成类工具
除了上面讲到的文本、图像等AIGC应用场景之外,音频、视频也是很多人会在工作、生活甚至是自媒体创业等领域,接触比较多的应用场景。 比如,短视频中的人声变音、语音合成,以及声音克隆等,都是音频AIGC的热门应用场景。当然,还包括动画、电影、游戏中的人物配音等工作,如今绝大多数都可以让AI来轻松搞定了。
音频AIGC工具按照其功能属性的不同,可以划分为两种:一、音乐处理工具 以So-Vits-Svc、Adobe Podcast AI Voice、魔音工坊等为代表,通过AI技术来修音、提高音频质量或是转换音色等;二、音乐制作工具 以MusicLM、网易天音、Aiva等为主要代表,可实现更加细分领域的“文本转音乐”功能。
Adobe Podcast Al
Voice
So-Vits-Svc So-Vits-Svc就是全网最火的模仿“孙燕姿”的背后AI。
So-Vits-Svc这款模型使用SoftVC内容编码器来提取真人歌手的源音频的语音特征,然后把它传进VITS语音合成模型中去,让歌手原声被保留下来。类似的“AI歌手”还有AI周杰伦、AI许嵩、AI王心凌等。
除了模拟知名的歌手嗓音之外,So-Vits-Svc还能基于电话录音、录像视频等素材来模拟大量真人声音。很多人也用这个工具做偏门。
Adobe podcast 可以在线一键增强语音,可以说是专业播客音频处理工具。
该工具也是由Adobe公司推出,由AI驱动的音频增强器,能利用AI来提高博客音频录制的质量。
用户在登录Adobe账号之后,上传好需要进行降噪处理的音频文件,AI便会自动处理音频文件,达到满意的音频播放效果之后,用户就能直接下载到电脑上自由使用
官网地址:https://podcast.adobe.com/
MusicLM 谷歌AI全家桶成员,会唱歌的AI模型。 MusicLM是Google发布的一款全真生成式AI模型,通过该模型,可以由文字直接生成高保真度的音乐。除了文字之外,无论是哼唱、演唱、敲击、乐器演奏等,MusicLM都可以在这些既有旋律上创建音乐,并能够确保音乐不失真。
MusicLM最大的亮点就在于,它可以根据一到两个提示词(prompt)就能生成一段5分钟的完整曲目。而且,风格多样,包括电子乐、爵士乐、蓝调、Pop等都不在话下。歌曲长度也可提前设定好,可以是一首5分钟的曲目,也可以是一个十几秒的哼唱小片段。
MusicLM还能生成由特定乐器演奏的曲段,而且,超牛的是,你可以自己设定演奏者的演奏水平,还能根据时代特色、演奏地点等创作音乐。比如可以给出指令:“具有80年代风格的、由管风琴在山巅演奏的流行音乐”等等。
官网地址:https://google-research.github.io/seanet/musiclm/examples/
讯飞听见 讯飞听见是科大讯飞旗下的另一款AIGC产品,功能是随时随地语音转文字。作为一款智能语音产品,讯飞听见依托于科大讯飞的自然语言处理、声纹识别和语音识别等语音技术,讯飞听见可满足用户在多种场景下的语音需求,适用场景涵盖会议记录、授课演讲、媒体访谈、个人写作等不同场合。
讯飞听见的优势还有,它可以为视频添加双语字幕,也可以做多语种同传翻译,还包括为视频会议生成字幕等。嗯,支持国产音频AIGC,可以考虑深度研究一下讯飞听见。
网易天音 可以实现一站式AI音乐创作的好工具。老互联网人都知道,网易在产品打磨上还是有一套的,其旗下产品虽不惊世骇俗,但也都非常受用户喜欢。
网易天音主要功能是进行AI音乐在线创作,它的最大优势在于音乐创作门槛低,用户能在短时间内根据指引完成一首原创音乐的编曲。
网易天音的工作台中包括了非常多且具体的音乐风格,比如流行、民谣、国风等等,支持用户从零开始创作一组自己的和弦,也支持将预设好的和弦拖进编辑段落当中,对全曲进行增减、复制、调整段落等编辑,全部编辑完成后会进行自动渲染,稍微等待就能得到一首自己创作的原创编曲。
顺便推荐一下网易创始人丁磊出的一本AI的书籍,相当不错。
官网地址:https://tianyin.music.163.com/
魔音工坊 魔音工坊对于做短视频赛道的伙伴来说,应该不陌生,尤其是对影视解说的大V来说,是他们必备的利器。 魔音工由北京小问智能科技有限公司开发的一款配音软件,为用户提供一站式AI配音服务。该平台的数字人,在当下也是非常好的应用。
应用魔音工坊的用户,能够非常容易的用它模拟出具有个人特色的真人语音,进行AI音频内容创作,让文字一键转换为真人语音。Fake You FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑工具,使用者可以使用任意人物角色的声音来创建音频,工具还提供了文本转语音功能,被誉为伪造声音的利器。
当用户输入一段想要生成的文字并选择好想要谁来念出这段文字,再点击“说话”按键,一段由目标人物“说”出的语音就自动生成出来了。目前,该工具也被广泛应用在短视频创作中。比如用名人图片制作他的数字人,并用FakeYou来实现这个名人的声音,从而做成一个短视频。如果有时间,潘哥可以拆解一下这个短视频制作的全流程。 官网地址:https://fakeyou.com/
图片生成数字人的方法可以参考:拆解最近爆火的“禅语”小和尚视频——AI制作方法揭秘
04
视频生成类工具
文生视频,应该也是接下来AIGC领域一个竞争极其激烈的一个赛道,互联网就是这么个路径发展而来的,由最初的文字、到图片、到音频在到现在的视频,AIGC路径也是如此。
Deepbrain
D-ID 文字转视频,虚拟数字人的超强AIGC工具,很多人接触视频类AI工具都是先从D-ID开始的。D-ID全称是de-identification,主要是人脸去识别化技术服务。简单点讲,短视频中,可以创造个虚拟化讲解员,在视频中代替真人出镜,介绍视频内容。
用户只需择自己想要的虚拟人形象,可以直接使用官方提供的丰富形象库,或者上传自己的人物照片。然后,在右侧文本框中输入你想让人物说的内容,或者上传本地的音频。D-ID内置了GPT模型,可以对你的文本进行润色。接下来,选择对应的语言、配音的声音和语调。点击生成视频,几分钟后,你就可以下载到制作完成的视频了。
官网地址:https://www.d-id.com/
Runway Gen-2 Gen-2是Runway推出的一款从端到端的Transformer模型,用户能以图片和文字为条件,从零开始生成一个原创的慢风格视频,30秒就可以生成电影大片。
Gen-2所生成的视频分辨率高达1280×720,时长约为30-60秒,目前可以实现以下几种功能:生成视频、生成图像、根据文字提示无限制扩展图像、混合图像风格、训练AI模型、删除视频中的某个元素、扣除背景等。
Gen-2是通过文字生成视频,完全是从无到有,可以说是最前沿的AI视频技术了。
官网地址:https://research.runwayml.com/gen2
DeepFakes DeepFakes(深度伪造)是一种合成媒体,它利用强大的人工智能(AI)和机器学习(ML)技术来生成极其逼真的虚假视觉和音频内容,从而使人类很难将其与原始内容区分开来。除了对DeepFakes概念的技术介绍外,该书还详细介绍了检测DeepFakes的算法、识别篡改内容和识别换脸的技术、生成对抗神经网络、媒体取证技术、深度学习架构、DeepFakes的取证分析等。 超强的变脸、换脸技术,让Deepfakes如今成为了AI合成视频的代名词。
Make-A-Video 文本直接转视频的超级好用的AIGC工具。由meta推出,我们只需输入几个简单的单词描述之后,该工具就会制作出一段无声的视频出来。
此外,基于“文生图”技术之上,Make-A-Video还能将静态的图片动画化。
Make-A-Video宣称:模型采用图像合成数据和未经标记的视频来进行训练,模型在学习之后能够“预测”图像接下来会发生什么、移动到哪个位置,并在极短的时间内移动到图像将会出现的位置,以此构成一个短视频。
官网地址:https://makeavideo.studio/
商汤智影商汤智影是商汤科技推出了商汤智广一站式广告营销平台,其中包括短视频创作引擎“商汤智影”。
该工具可一键生成创意短视频,包括脚本生成、背景替换、横竖屏替换、生成字幕等短视频广告生产的多种服务,能帮助广告主节约广告内容制作成本,已经成为了短视频达人宝藏神器。
商汤智影中包括的“视频元素分析”服务,能够通过AI视频结构化技术,对短视频中每一个镜头的长度、景别、场景、人物、道具以及台词等信息进行分析和提取,并自动创作一个分镜头脚本,大大减少了脚本撰写的时间,有效辅助创作者进行二次创作。
调侃一下,商汤晚于盘古,从大模型角度,是不是也落后于华为盘古呢?哈哈哈哈哈
官网地址:https://www.sensetime.com/cn/product-index
以上就是本篇文章【54款宝藏级AIGC工具分享(claude,Midjourney,Stable Diffusion等)】的全部内容了,欢迎阅览 ! 文章地址:http://lanlanwork.gawce.com/news/11209.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 阁恬下移动站 http://lanlanwork.gawce.com/mobile/ , 查看更多