明文视界 AI 资源站

欢迎来到 明文视界!

在这里,我将非常棒的 AI(人工智能)项目搜集整理 —— 包括最前沿的项目, 应用, 资源,以及神奇的工具等.

这是个飞速变化的时代, 非常令人兴奋, 独乐乐不如众乐乐, 让我们一起感受 AI 带来的令人振奋的进化.

这里还准备了 ComfyUI 一手学习资源,有 ComfyUI 小白教程, 进阶教程, 高手教程. 🚀 (正在搬砖施工中)

来一起玩转 AI,体验技术带来的快乐吧!微信公众号 明文视界.

明文视界 GitHub ComfyUI 节点项目:

  • Comfyui_HeyGem: 目前 (2025.05.22) 最好的开源数字人, 没有之一. 基本可生成全身, 动态, 任意分辨率数字人.
  • ComfyUI_ASR-zh: 快速高效中文语音识别, 可识别带音乐的歌声, 用来给歌曲自动生成带字幕 MV.
  • ComfyUI_parakeet-tdt: 英伟达高效, 高质量英文语音识别模型, 几秒钟识别几分钟音频.
  • ComfyUI_ACE-Step: 快速, 高质量音乐生成基础模型(20 秒 4 分钟音乐). 音乐编辑, 扩展, “重绘”, Remix 等等.
  • ComfyUI_IndexTTS: B 站开源高效, 高质量声音克隆, 比肩 MegaTTS, 可自定义音色.
  • ComfyUI_MegaTTS3: 字节非常强的声音克隆节点, 速度快, 中英文(可跨语言克隆), 克隆声音几乎一模一样. 只是不支持自定义音色.
  • ComfyUI_PortraitTools: 肖像, 图片处理工具节点, 包括自定义路径加载图片(包括子目录); 图片, 视频上水印; 图片按面部矫正; 面部检测裁剪; 证件照生成; 图片简单美化等.
  • ComfyUI_Prompt-All-In-One: 为所有影,音,图,文创作生成提示的 ComfyUI 节点. 包括 joy 反推; 谷歌 Gemini 全家桶; DeepSeek; Qwen 全家桶等.
  • ComfyUI_OneButtonPrompt: 在 comfyui 中一键辅助生成提示 (用于图像和视频生成等) 的节点. 辅助生成提示词, 各种主题风格, 姿态, 色彩, 等等等等任意选, 然后用其他工具优化一下.
  • ComfyUI_AudioTools: 音频处理等相关的 ComfyUI 节点. 包括 任何地方暂停工作流执行; 任何地方暂停修改提示词(字符串); 自定义加载音频; 视频自动添加字幕; 音频任意时间刻度裁剪; 音频音量, 速度, 音高, 回音处理等; 去除音频中无声部分; 录音; 音频水印嵌入等.
  • ComfyUI_StepAudioTTS: Step-Audio-TTS 的 ComfyUI 节点, 文本转语音, 可说话, 唱歌, RAP, 或者克隆声音.
  • ComfyUI_SparkTTS: 在 Comfyui 中使用 Spark-TTS. Spark-TTS: 一种基于 LLM 的高效文本到语音模型,能克隆各种语言的声音.
  • ComfyUI_NotaGen: NotaGen 的 ComfyUI 节点. 可以同时生成古典音乐和曲谱.
  • ComfyUI_KokoroTTS_MW: Kokoro-TTS 的快速文本转语音节点. 支持 8 种语言和 150 种音色.
  • ComfyUI_gemmax: 小米 GemmaX 翻译, 支持 28 种语言的 ComfyUI 节点.
  • ComfyUI_EraX-WoW-Turbo: 超快速多语言语音识别的 ComfyUI 节点. 可带时间戳.
  • ComfyUI_DiffRhythm: 快速而简单的歌曲生成 ComfyUI 节点.
  • ComfyUI_CSM: 声音克隆, 多轮对话节点, 可根据对话情绪变化情绪, 只支持英文.
  • ComfyUI_Dia: 一次生成超真实声音克隆对话, 只支持英文.
  • ComfyUI_OuteTTS: 多种语言声音克隆, 中文效果不是很理想.

明文视界仙宫云镜像:

LIBLIB AI:

https://www.liblib.art/userpage/53a1edbdf5394aaba7028eff2aaec867

爱发电:

欢迎用爱发电. 希望我能够为您在 AI 学习路上排忧解难. 开源项目安装部署, 整合包 或 ComfyUI 影,音,图,文,整合包,工作流,安装,使用等问题咨询(2次/月).不能解决的问题不计次数.

https://ifdian.net/a/mwsjai