3 个令人惊艳的 GitHub 开源项目,诞生了!
阅读本文大概需要 5 分钟。
2023 上半年在科技圈中,随着 ChatGPT 的面世,让 AI 领域这个看似沉浸已久的科技行业,重新回到了人们的视野中。各种 AI 工具层出不穷,无数网友惊叹技术进步之快。
作为目前拥有诸多开发者受众的技术社区,GitHub 在过去这段时间,也陆陆续续诞生了不少实用的 AI 工具。
这些工具都有着相同的特点,简单易用且高效,主打一个新奇亮眼,顺便解放你的个人生产力。
今天就给大家推荐几个 GitHub 上比较热门的 AI 工具,让大家体验一下人工智能的神器与强大之处。
AI 生成专属头像
去年 Midjourney 和 Stable Diffusion 这两款 AI 绘画神器一经发布,让诸多专业摄影师、设计师、艺术创作者都倍感震撼。大家都没想到,能够抢自己饭碗的,不是同行,而是 AI。
那些经 AI 之手创作的图像,艺术风格极具创意且逼真形象。当中有一些作品,甚至还拿到了艺术博览会的冠军,或卖到了 40 万美元的高价。
随着今年这波 AI 风口的兴起,让这两款神器再次走进人们的视野,但与上次不同的是,这次很多普通网友都开始上手学习,并参与创作,再利用工具能力进行变现。
前阵子有不少朋友帮人做 AI 头像专属定制,也能时不时赚几杯奶茶钱。
其实想做头像定制,也没那么难,今天给大家推荐一个在 GitHub 上开源的 AI 工具:Photoshot。
用户将自己的个人头像上传后,可借助 Stable Diffusion 模型进行训练,并生成一款拥有不同风格的个人头像。
GitHub:https://github.com/shinework/photoshot
该项目在 GitHub 上开源半年多,里面用到的一些技术栈,放到今天,依然不会过时。下面我整理一下,供大家参考学习:
-
Next.js 开发 webapp;
-
Chakra UI 开发 UI 组件;
-
Prisma 作为数据库;
-
Replicate 机器学习模型云托管平台;
-
Stripe OpenAI 联合创始人做的第三方支付;
-
Stable Diffusion 当下最为流行的文生图开源模型;
AI 一键实现图像处理
今年 Meta 在 GitHub 开源 Segment Anything Model(SAM)以后,图像领域真正做到了「万物皆可分割」,开发者处理图像分割任务的流程进一步简化,成本大幅下降。
作为计算机视觉中尤为重要的一个研究方向,图像分割在近几年一直倍受业界关注。现在技术已经足够成熟,我们也能做出更多有趣的 AI 应用。
比如结合图像分割与图像处理,让 AI 实现照片水印去除,老照片一键修复,图像中的物品对象替换等等。
今天给大家推荐一款开源的图像修复工具:Lama Cleaner,基于 SOTA AI 模型构建,功能颇为齐全。
该工具可用于快速去除图像中各种物品、人物、字体、水印等对象,并支持老照片修复、文本替换图像内容等。
GitHub:https://github.com/Sanster/lama-cleaner
项目免费开源,支持自托管。如果担心数据隐私安全的话,可以把项目托管到自己的服务器上,让数据 under control。
另外,该工具还内置了插件系统,如果机器配置跟得上,你可以往里面再集成一些类似 RealESRGAN(生成高分辨率图像)、GFPGAN(人脸修复)等开源模型,为工具增添更多功能。这整得就跟开菜馆一样,丰俭由人。
AI 实现视频自动剪切
近几年,短视频的风口一直在持续,各大社交网站也都针对短视频流量进行大力扶持。身边陆陆续续有朋友从大厂离职,加入自媒体行业,大多首选的内容创作类型,便是短视频。
短视频制作流程,一般主要分为制定主题、脚本构思、素材拍摄、视频剪辑。其中视频剪辑对技术要求颇高,不过一旦熟练掌握,不少流程也能实现自动化。
曾任亚马逊首席科学家的李沐老师,从两三年前便开始在 B 站授课,向大众科普 AI 技术知识,拆解主流论文中的技术实现原理与应用方向。
在此过程中,他根据自己的视频剪辑需求,随手做出了一款视频剪辑工具:AutoCut,可通过字幕快速剪切视频,现已开源至 GitHub。
该工具支持自动生成字幕,用户无需使用视频编辑软件,仅需编辑文本文件,即可完成剪切。
GitHub:https://github.com/mli/autocut
项目采用的是 OpenAI 开源的自动化语音识别(ASR)系统,使用从网络收集的 68 万小时的多语言和多任务监督数据进行训练。
它能够根据视频语音,自动批量化生成字幕文件,其中英文语音的生成质量最高。
利用 Whisper 能够自动生成字幕的视频,对一些空白字幕内容配合脚本,进行视频自动剪切,便能够节省很多视频剪辑的时间。
以上,就是本期为大家推荐的几个 GitHub 项目,希望对大家有所帮助。
白丁学者 » 3 个令人惊艳的 GitHub 开源项目,诞生了!