1.推荐一款Meta出品的源码AI版神笔马良工具
2.尝试了200个AI代码生成器,这47个是搜集我觉得最好用的~~~从此再无编程小白!(第一期)
3.阿尔法元之五子棋源码解读(AlphaZero-Gomoku)
4.腾讯T2I-adapter源码分析(3)-训练源码分析
5.基于AI或传统编码方法的源码图像压缩开源算法汇总
6.腾讯T2I-adapter源码分析(1)-运行源码跑训练
推荐一款Meta出品的AI版神笔马良工具
小马同学喜欢画各种小人,尽管谈不上精细美观,搜集但活灵活现的源码神态总让我惊叹。
能否让这些小人动起来?偶然间,搜集爱q生活网源码我们发现了一个有趣的源码AI工具。
1. 访问此网址:sketch.metademolab.com
2. 上传你绘制的搜集小人照片,点击“下一步”。源码
3. 系统将自动识别小人的搜集人体区域,一般能准确识别,源码对于过于抽象的搜集画作,也可手动调整。源码
4. 系统识别小人各部分,搜集找出每个像素。源码
5. 系统识别小人特征点和骨架,如眼睛等细节可手动调整。
6. 选择你想要的动画类型,如走路、跳舞等。
最后,小马同学与小人进行了一场跳绳比赛,趣味无穷。
这款由Meta出品的AI工具,颇似中国的动画片“神笔马良”,为大小朋友们带来了无尽的乐趣。
如果你对技术感兴趣,可以参考以下资源:
1. 工具官方网站:Animated Drawings (metademolab.com)
2. 源码仓库:GitHub - facebookresearch/AnimatedDrawings (探索更多功能,如多卡通小人的视频合成,或通过其他工具定义更多的人体运动模版)
尝试了个AI代码生成器,这个是我觉得最好用的~~~从此再无编程小白!(第一期)
Codeium 是一种人工智能驱动的代码完成工具,旨在简化编码过程。支持 多种语言并与流行的 IDE 集成,减少样板代码,查找和使用 API,并生成单元测试。允许开发人员以自然语言键入注释以完成代码,被 Adobe、Dropbox、IBM、Pinterest、Salesforce 和 Tesla 等顶级公司信赖,且免费使用。
Safurai 是一个基于 AI 的 IDE 扩展,帮助开发人员进行编码、调试和重构。充当虚拟助手,为软件开发过程中可能出现的任何问题提供解决方案和建议,改进工作流程和代码质量。
GitFluence 是一种人工智能驱动的解决方案,帮助用户快速找到适合其特定需求的正确 git 命令。易于使用的网络应用程序,输入所需 git 操作的描述并接收相关命令建议,省时省力。
Phind 是专为开发人员设计的人工智能搜索引擎,可定制搜索,探索功能,微营销 源码提供 AI 驱动的相关主题和增强搜索结果的建议,还有 Surprise Me 功能随机选择主题供用户发现和探索。
Cron AI 是一种人工智能驱动的 cron 表达式生成器,简化 cron 作业的创建。易用性,快速将输入的单词转换为 cron 表达式以设置 cron 作业,效率高,减少创建 cron 作业所需的复杂性和时间。
Amazon CodeWhisperer 是一项由机器学习 (ML) 提供支持的服务,根据开发人员在集成开发环境 (IDE) 中以自然语言和代码发表的评论生成代码建议,提高开发人员的工作效率。
AI CLI 是开源 GPT -3 Powered CLI,当前提示长度为 ~ 个令牌,1K 令牌的 text-davinci- 定价为 0. 美元,即 ~0. 美元/命令,考虑通过微调改善响应并降低每条命令的成本。
Bito 是一款由 AI 驱动的代码助手,帮助开发人员自动执行任务并将生成代码的速度提高 倍。生成代码、构建单元测试、创建代码注释、解释新代码以及检查安全漏洞,适用于 AppCode、GoLand、IntelliJ、PyCharm、PhpStorm、Rider、RubyMine 和 WebStorm,注重用户隐私,从不存储或复制代码,始终对数据和日志进行加密。
Google Colab Copilot 是一款旨在自动化 Google Colab 工作区、简化用户体验的工具。在 Google Colab 上无缝实施,轻松设置,便捷激活,满足数据科学家、研究人员和开发人员的需求。
Codium 是一种人工智能工具,帮助开发人员更快地编写测试并在部署前发现错误。分析源代码、文档字符串和注释以生成有意义的测试,提供测试建议,侧重于边缘情况和方法参数以确保准确性。
Code GPT 是一个 VS 代码扩展,具有 StackOverflow 支持、解释、重构、文档、查找问题和单元测试等优秀功能。
Arduino 代码生成器 是一种人工智能工具,为 Arduino 兼容板自动执行代码生成过程。利用 GPT-3 算法快速生成代码,节省用户时间,提供有关 Arduino 项目的零件、组件和教程的源码网站 哪些建议,允许用户直接从网站购买零部件。
Hacker AI 是一种由人工智能驱动的代码审计工具,旨在识别和修复源代码中潜在的安全漏洞。扫描源代码以查找安全问题,帮助组织检测和修复漏洞以防止网络攻击,测试期间免费,无需创建帐户,用户在 分钟内收到漏洞报告。
Refraction 是一种基于 AI 的代码改进工具,简化开发过程。适用于 C#、C++、Go、Java、JavaScript、TypeScript、PHP、Python、R Lang、Ruby 和 Swift,自动重构和测试,代码解释、语言转换、硬编码文字分离和样式检查。
Maverick 是一种由 AI 提供支持的代码完成工具,基于 Yurts,专注于在不接触任何 API 或知识库的情况下在本地机器上提供最佳代码完成。
Buildt AI 是一种基于人工智能的代码库搜索工具,简化开发人员的代码管理。使用自然语言搜索快速准确地查找、生成和替换代码片段,生成新代码、重构现有代码、扩展功能以及删除遗留或重复代码,添加或更新依赖更改,支持 Javascript 和 Typescript,未来计划支持 + 语言。
CodeGeeX 是一个拥有 亿参数的大规模多语言代码生成模型,在超过 种编程语言的大型代码语料库上进行预训练,支持 种以上的代码生成和翻译编程语言。
Programming Helper 是一种人工智能工具,协助完成各种编程任务。从文本描述生成代码、SQL 命令、HTML 和 CSS,将代码翻译成任何编程语言并用通俗易懂的英语解释代码,修复无效代码、生成测试并向代码添加类型,创建正则表达式、查找 Git 命令、获取 Linux 命令以及根据描述生成元标记,提供编程相关问题的解答。
CodeAssist 是一个人工智能聊天机器人界面,专为在 Jetbrains IDE 和 Visual Studio Code 中编程而设计。与聊天机器人交流,就像与人交谈一样,允许它查看和修改代码,java applet源码根据用户的代码库生成代码完成,考虑代码库其他部分的文件和函数/类,适用于所有流行的编程语言,提供更集中的响应。
Clippy AI(VS 代码扩展)是 OpenAI Codex 的简单包装器,允许您向 Codex 发送您的当前文件以及一些纯文本英语说明,然后它会在您的编辑器中打开一个差异视图,以便您可以轻松查看建议的更改并接受或拒绝它们。
阿尔法元之五子棋源码解读(AlphaZero-Gomoku)
阿尔法元在五子棋领域的源码解析揭示了强化学习在简单游戏中的深度应用。相较于围棋,五子棋虽简单,但其源码分析同样能让我们深入理解强化学习的原理。AlphaZero,最初凭借阿尔法狗的深度学习技术,后在没有人类干预的情况下,通过三天自学围棋并超越前辈,展现了人工智能的新里程碑。
本文着重探讨AlphaZero在五子棋上的具体应用,源码可在GitHub上获取,路径公开。理解该项目的前提是对强化学习有一定基础,如马尔可夫决策过程和蒙特卡洛方法。项目主要包含策略价值网络、蒙特卡洛树搜索算法和训练脚本,它们共同构建了强化学习与深度学习的交互过程。
项目的架构包括游戏处理、MCTS算法实现、策略价值网络训练以及人机对战脚本。Game.py定义了棋盘和游戏逻辑,mcts_alphaZero.py与mcts_pure.py则是MCTS玩家的实现,分别对应AlphaZero和纯MCTS版本。policy_value_net.py负责网络模型,根据不同框架实现,如Tensorflow或Pytorch。train.py则实现了AlphaZero的训练流程,通过模拟对弈和数据增强来优化网络。
运行项目,你可以通过human_play.py与预训练的AI对战,感受强化学习的力量。源码剖析中,human_play.py脚本的核心是创建棋盘、玩家,并通过循环进行人机对弈,直到游戏结束。
腾讯T2I-adapter源码分析(3)-训练源码分析
随着stable-diffusion和midjourney等AI技术展现令人惊叹的艺术创作,人们对AI可控绘图的追求日益高涨。为提升AI图像生成的可控性,Controlnet和T2I-adapter等解决方案应运而生。系列文章将从T2I-adapter的源码出发,深入剖析其训练部分的实现原理。
本篇我们将聚焦于训练源码的解析,通过代码结构的梳理,了解T2I-Adapter的训练流程。
训练代码的运行涉及数据处理、模型加载、优化器设置以及实际训练过程。在第一部分,下位机源码我们首先设置参数并加载数据,如DepthDataset,它从txt文件中读取、对应的深度图和文本描述。
在模型加载阶段,我们区分了stable-diffusion模型和adapter。stable-diffusion模型加载时,其配置与推理阶段有所差异,如增加调度器参数、提高精度、调整分辨率和训练相关参数。adapter模型的加载则遵循推理过程中的初始化方法,通过构建不同模块来实现。
训练过程中,adapter模型的关键结构包括下采样、卷积和ResnetBlock的使用,相比controlnet,T2I-adapter的参数更少,没有注意力层,这使得训练更为高效。模型放入GPU后,使用adamW优化器进行训练,同时设置学习率和数据保存路径。
状态恢复部分,程序会判断是否从头开始或恢复训练,设置log信息。接下来,代码进入实际的训练循环,包括条件编码、隐藏状态生成、adapter结果附加至sd模型以及adapter梯度计算。
loss函数定义在模型配置中,采用L2损失来衡量生成图像与给定时间点加噪ground truth的接近程度。训练过程中,loss计算和模型保存都在代码中明确体现。
总的来说,T2I-adapter的训练源码展示了精细的结构和参数设置,确保了AI绘画的可控性和性能。在AI艺术的探索中,每一行代码都承载着技术进步的点滴痕迹。
基于AI或传统编码方法的图像压缩开源算法汇总
探索图像压缩技术的前沿,融合AI与传统编码策略,我们精选了多项开创性研究成果,旨在提升图像压缩的效率与视觉质量。让我们一同探索这些卓越的算法:Li Mu等人的突破:年CVPR大会上,他们提出了《Learning Convolutional Networks for Content-weighted Image Compression》(论文链接),借助深度学习的自编码器,赋予内容感知,通过优化编码器、解码器和量化器,赋予图像在低比特率下更清晰的边缘和丰富纹理,减少失真。其开源代码可于这里找到,基于Caffe框架。
Conditional Probability Models的革新:Mentzer等人在年的CVPR展示了他们的工作,通过内容模型提升深度图像压缩的性能,论文名为《Conditional Probability Models for Deep Image Compression》(论文链接)。
利用深度神经网络的力量,研究者们正在重新定义压缩标准。例如,Toderici等人在年的CVPR中展示了《Full Resolution Image Compression with Recurrent Neural Networks》,使用RNN构建可变压缩率的系统,无需重新训练(论文链接)。其开源代码可在GitHub找到,基于PyTorch 0.2.0。 创新性的混合GRU和ResNet架构,结合缩放加性框架,如Prakash等人年的工作所示,通过一次重建优化了率-失真曲线(论文链接),在Kodak数据集上,首次超越了JPEG标准。开源代码见这里,基于Tensorflow和CNN。 AI驱动的图像压缩,如Haimeng Zhao和Peiyuan Liao的CAE-ADMM,借助ADMM技术优化隐性比特率,提高了压缩效率与失真性能(论文),对比Balle等人的工作(论文)有所突破。 生成对抗网络(GAN)的优化应用,如.论文,展示了在低比特率下图像压缩的显著改进,开源代码可在GitHub找到,它以简洁的方式实现高图像质量。 深度学习驱动的DSSLIC框架,通过语义分割与K-means算法,提供分层图像压缩的高效解决方案,开源代码在此,适用于对象适应性和图像检索。 传统方法如Lepton,通过二次压缩JPEG,节省存储空间,Dropbox的开源项目链接,适合JPEG格式存储优化。 无损图像格式FLIF,基于MANIAC算法,超越PNG/FFV1/WebP/BPG/JPEG,支持渐进编码,详情可在官方网站查看。 Google的Guetzli,以高效压缩提供高画质JPEG,体积比libjpeg小-%,适用于存储优化(源码)。 这些创新的算法和技术,展示了AI和传统编码方法在图像压缩领域的融合与进步,不仅提升了压缩效率,更为图像的存储和传输提供了前所未有的可能性。腾讯T2I-adapter源码分析(1)-运行源码跑训练
稳定扩散、midjourney等AI绘图技术,为人们带来了令人惊叹的效果,不禁让人感叹技术发展的日新月异。然而,AI绘图的可控性一直不是很好,通过prompt描述词来操控图像很难做到随心所欲。为了使AI绘制的图像更具可控性,Controlnet、T2I-adapter等技术应运而生。本系列文章将从T2I-adapter的源码出发,分析其实现方法。
本篇是第一篇,主要介绍源码的运行方法,后续两篇将以深度图为例,分别分析推理部分和训练部分的代码。分析T2I-Adapter,也是为了继续研究我一直在研究的课题:“AI生成同一人物不同动作”,例如:罗培羽:stable-diffusion生成同一人物不同动作的尝试(多姿势图),Controlnet、T2I-adapter给了我一些灵感,后续将进行尝试。
T2I-Adapter论文地址如下,它与controlnet类似,都是在原模型增加一个旁路,然后对推理结果求和。
T2I-Adapter和controlnet有两个主要的不同点,从图中可见,其一是在unet的编码阶段增加参数,而controlnet主要是解码阶段;其二是controlnet复制unit的上半部结构,而T2I-Adapter使用不同的模型结构。由于采用较小的模型,因此T2I-Adapter的模型较小,默认下占用M左右,而controlnet模型一般要5G空间。
首先确保机器上装有3.6版本以上python,然后把代码clone下来。随后安装依赖项,打开requirements.txt,可以看到依赖项的内容。然后下载示例,下载的会放到examples目录下。接着下载sd模型到model目录下,再下载T2I-Adapter的模型到目录下,模型可以按需到huggingface.co/TencentA...下载。这里我下载了depth和openpose。sd模型除了上述的v1-5,也还下载了sd-v1-4.ckpt。
根据文档,尝试运行一个由深度图生成的例子,下图的左侧是深度图,提示语是"desk, best quality, extremely detailed",右侧是生成出来的。运行过程比较艰辛,一开始在一台8G显存的服务器上跑,显存不够;重新搭环境在一台G显存的服务器上跑,还是不够;最后用一台G显存的服务器,终于运行起来了。
接下来尝试跑openpose的例子,下图左侧是骨架图,提示词为"Iron man, high-quality, high-res",右侧是生成的图像。
既然能跑推理,那么尝试跑训练。为了后续修改代码运行,目标是准备一点点数据把训练代码跑起来,至于训练的效果不是当前关注的。程序中也有训练的脚步,我们以训练深度图条件为例,来运行train_depth.py。
显然,习惯了,会有一些问题没法直接运行,需要先做两步工作。准备训练数据,分析代码,定位到ldm/data/dataset_depth.py,反推它的数据集结构,然后准备对应数据。先创建文件datasets/laion_depth_meta_v1.txt,用于存放数据文件的地址,由于只是测试,我就只添加两行。然后准备,图中的.png和.png是结果图,.depth.png和.depth.png是深度图,.txt和.txt是对应的文本描述。
文本描述如下,都只是为了把代码跑起来而做的简单设置。设置环境变量,由于T2I-Adapter使用多卡训练,显然我也没这个环境,因此要让它在单机上跑。而代码中也会获取一些环境变量,因此做简单的设置。
做好准备工作,可以运行程序了,出于硬件条件限制,只能把batch size设置为1。在A显卡跑了约8小时,完成,按默认的配置,模型保存experiments/train_depth/models/model_ad_.pth。那么,使用训练出来的模型试试效果,能生成如下(此处只是为了跑起来代码,用训练集来测试),验证了可以跑起来。
运行起来,但这还不够,我们还得看看代码是怎么写法,下一篇见。
PS:《直观理解AI博弈原理》是笔者写的一篇长文,从五子棋、象棋、围棋的AI演进讲起,从深度遍历、MAX-MIN剪枝再到蒙特卡罗树搜索,一步步介绍AI博弈的原理,而后引出强化学习方法,通俗易懂地介绍AlphaGo围棋、星际争霸强化学习AI、王者荣耀AI的一些强化学习要点,值得推荐。
AUTOMATIC的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持controlnet、lora等技术,我们也分析了它的源码实现,写了一系列文章。
这个网站真的太香了!居然可以免费使用AI聊天工具和“智能AI聊天助手”项目源码!!!
在AI技术日益盛行的今天,许多开发者都在寻找免费且好用的AI工具。我经过三个月的探寻,终于发现了一个宝藏网站——云端源想!它不仅提供免费的AI聊天工具,还有令人惊喜的项目源码可以领取,对于编程新手和进阶者来说,简直是福音!
这个网站近期已正式上线,我强烈推荐的原因有三:首先,免费AI聊天工具和源码的双重福利,对于需要项目实战和提升技能的开发者来说,就像是及时雨;其次,网站的“微实战”版块提供了针对性强、价格亲民的项目实战项目,如商城支付功能,能快速提升开发效率;再次,智能AI工具中的问答功能尤其实用,能帮助解决写代码时的难题。
在社区动态中,你可以找到休息时的轻松分享,而在编程体系课部分,虽然与其他网站相似,但云端源想的提炼知识点设计使得学习更加有针对性。在线编程功能则提供了协作开发的平台,而论坛则汇集了高质量的技术文章,供你参考和学习。
总的来说,云端源想网站不仅提供了丰富的免费资源,还通过实用的工具和学习资源,帮助开发者提升技能,是值得推荐的工具平台。别犹豫,赶快通过下方链接去体验这个网站的福利吧!
AI与PDE(七):AFNO模型的源代码解析
本文旨在解析AFNO模型的源代码,帮助读者理解模型细节与主干结构。首先,AFNO模型的主干框架在afnonet.py文件中定义,通过类AFNONet实现。模型的核心功能封装在多个类与函数中,依据代码注释逐步解析。
在代码中,forward_features函数负责模型的核心逻辑,包括patch切割与mixing过程。这些操作由PatchEmbed类实现。位置编码self.pos_embed通过高斯初始化得到,增加模型的表示能力。
关键模块AFNO2d位于代码中,它基于FNO的原理,负责处理输入数据。AFNO2d模块在forward_features函数中通过循环调用,实现数据的转换与混合。
经过数个L layer处理后,模型进入类似解码器的结构,用于将中间结果映射为目标结果。这一过程通过self.head(x)实现,以解决特定分类问题。
本文通过梳理代码流程与结构图,直观展示了AFNO模型的工作原理。读者可参考AFNO的GitHub源代码与论文,深入理解细节。后续文章将继续探讨基于AFNO模型框架的其他应用,如FourCastNet。
大神用Python做个AI出牌器,实现财富自由附源码
在互联网上,我注意到一个有趣的开源项目——快手团队的DouZero,它将AI技术应用到了斗地主游戏中。今天,我们将通过学习如何使用这个原理,来制作一个能辅助出牌的欢乐斗地主AI工具,也许它能帮助我们提升游戏策略,迈向财富自由的境界。 首先,让我们看看AI出牌器的实际运作效果: 接下来,我们逐步构建这个AI出牌器的制作过程:核心功能与实现步骤
UI设计:首先,我们需要设计一个简洁的用户界面,使用Python的pyqt5库,如下是关键代码:
识别数据:在屏幕上抓取特定区域,通过模板匹配识别AI的手牌、底牌和对手出牌,这部分依赖于截图分析,核心代码如下:
地主确认:通过截图确定地主身份,代码负责处理这一环节:
AI出牌决策:利用DouZero的AI模型,对每一轮出牌进行判断和决策,这部分涉及到代码集成,例如:
有了这些功能,出牌器的基本流程就完成了。接下来是使用方法:使用与配置
环境安装:你需要安装相关库,并配置好运行环境,具体步骤如下:
位置调整:确保游戏窗口设置正确,AI出牌器窗口不遮挡关键信息:
运行测试:完成环境配置后,即可启动程序,与AI一起战斗:
最后,实际操作时,打开斗地主游戏,让AI在合适的时间介入,体验AI带来的智慧策略,看看它是否能帮助你赢得胜利!