1.DragGAN官方代码手把手安装部署教程
2.NVIDIA Modulus 23.03安装和使用方法
3.英伟达被黑客攻击,英伟DLSS源代码泄露,达源业务会受影响吗?
4.极智开发 | 解读英伟达软件生态 一切的码下基础CUDA
5.24行代码完成批量缩星
DragGAN官方代码手把手安装部署教程
在StableDiffusion尚未问世的时期,DragGAN是载英生成领域的领头羊。四年前,伟达StyleGAN的程序系统定制源码开发发布以其“超高清且逼真”的效果震惊了众人。
当时,下载我的英伟公众号"托尼是塔克"上发布了一系列关于该项目的文章。时光荏苒,达源没想到这个项目还能焕发新生。码下
回到正题,载英今天我将带领大家一步一步完成DragGAN的伟达安装部署。
StyleGAN的程序安装过程繁琐,需要安装VS、下载cudnn、英伟cuda等软件,还要修改代码并配置路径等等。相比之下,DragGAN的环境配置几乎与StyleGAN3完全一致,安装过程自然也不会简单。
我将分享我的安装流程,并记录下来,以供参考。
如果嫌麻烦,也可以下载离线版本,一键运行。
环境配置如下:
操作系统:Win
显卡:RTX
辅助软件: CMD、Git、Conda、VS、cudnn、cuda
显卡是波段趋势线指标源码GAN项目的关键硬件,不同尺寸模型所需的显存不同。RTX可完美支持x任务,一般情况下6G显存足以运行这个项目。
关于基础软件的详细安装步骤,可参考我之前关于Stylegan2和 Stylegan3的教程。
现在让我们开始今天的主题:
1. 获取源代码
由于这是一个开源项目,我们首先需要获取源代码。获取源代码有两种方式:命令行或直接下载压缩包。
命令行方式:确保安装了Git工具,然后在CMD中执行如下命令:
切换到E盘或D盘(避免C盘),进入DEV文件夹,获取DragGAN的源代码。
压缩包获取方式:点击Download ZIP下载,然后解压至磁盘,比如E盘DEV文件夹。
解压后,去除文件名中的“-main”。这个main曾用“master”命名,但因不尊重某类人而更改。
2. 创建虚拟环境
这是一个基于Python的项目,为了保证不同项目的独立性,我们将使用Conda创建虚拟环境。
在CMD中输入以下命令,创建并激活虚拟环境。
3. 修改配置文件
DragGAN包含一个Conda依赖文件,可以直接用来创建虚拟环境并安装所有依赖。
然而,这个文件在当前Windows环境下可能存在安装问题,如找不到cudatoolkit=.1。我尝试修改,但其他问题依旧。java 软键盘源码因此,我自行创建了一个requirements.txt文件,将内容粘贴其中,并放在DragGAN文件夹中,使用pip安装。
4. 下载模型
项目官方提供了一个下载模型的sh脚本,但Windows用户无法直接使用。解决方法是右键打开下载_model.sh文件,获取模型下载地址并下载,解压至DragGAN的checkpoint文件夹,并将模型文件名改为stylegan2_开头。
发现了一个叫download_model.bat的文件,可以一键下载模型。
5. 运行项目
按照上述步骤,我们就可以运行项目了。网络通畅时,一般不会出现问题。运行如下命令启动GUI界面:
在GUI界面上,只需点击“Start”按钮,拖拽狗子脸部,即可生成。GUI动态效果很酷,但菜单较小,有时会崩溃,模型切换也不方便。
启动WebUI,输出网址后,打开即可查看生成的。使用方法包括选择模型、种子、点选位置并拖拽等。小说自动采集网站源码
WebUI版的动态效果不如本地GUI,但最终结果相同。
项目提供了许多高质量模型,如英伟达官方的FFHQx和human模型。生成的可保存,但与真实相比,效果参差不齐。
了解了这些不足,这个项目仍然很有趣,可以可视化StyleGAN的使用,快速接入各种模型。如果有财力,可以自己训练模型。
虽然项目成本高昂,但结果值得期待。至少,它将StyleGAN的使用可视化,为用户提供了丰富的模型选择。
NVIDIA Modulus .安装和使用方法
如果你对NVIDIA的Modulus .版本感兴趣,以下是你需要了解的安装和使用指南。从年开始,Modulus将进行重大更新,建议直接从.版本开始,因为它将成为新开发的基础,旧版本将不再维护,所有功能将迁移至此。 Modulus .开源,可在GitHub获取。新版本主要由两个部分组成:Modulus包和modulus-sym包。sym包整合了大量API接口,以下是一键转发 源码部分核心模块的导入示例: from modulus.sym.hydra import to_absolute_pathfrom modulus.sym.solver import Solver
from modulus.sym.domain import Domain
...
from modulus.sym.utils.io.plotter import ValidatorPlotter
安装步骤如下:首先,从GitHub下载modulus源代码,确保选择正确的版本,然后构建镜像:
#docker build -t modulus:ci --target ci -f Dockerfile .启动镜像,在其中安装modulus-sym:
#pip install .可能需要额外安装一些依赖,如:
sudo apt-get install libx-6sudo apt install libgl1-mesa-glx
sudo apt-get install libxrender1
完成以上步骤后,你就可以开始编写并运行Modulus .的代码了。对于进一步的技术交流和疑难解答,我们建议加入以下QQ群: 群名称:英伟达Modulus仿真技术交流(PINN)群号:
这里是一个活跃的社区,可以与同行分享经验和解决问题。祝你在使用Modulus .的过程中顺利!英伟达被黑客攻击,DLSS源代码泄露,业务会受影响吗?
黑客帝国再起风云:英伟达遭遇大规模数据窃取</ 据彭博社、每日电讯报和TheVerge权威报道,全球科技巨头英伟达近期遭受了黑客的猛烈攻击。据披露,这家南美黑客组织LAP$声称窃取了超过1TB的独家技术资料,引发了业界的广泛关注。幸运的是,LAP$已备份数据,使得英伟达的反击行动未能得逞。 尽管如此,英伟达在一份针对Hardwarexx德国硬件爱好者网站的声明中坚称,此次事件并未造成业务中断的威胁。他们迅速采取行动,强化网络安全,聘请专家应对,并与执法部门保持紧密合作。尽管存在威胁参与者获取员工凭证和部分专有信息的风险,但英伟达团队正在全力以赴进行调查,以确保信息安全。 值得注意的是,TechPower报道称,黑客已将深度学习超级采样(DLSS)的源代码公之于众,这项技术是英伟达的看家本领,尤其在游戏性能提升方面发挥关键作用。尽管英伟达曾因封闭源代码引发争议,但现在开源技术如FSR和XeSS的竞争加剧。然而,尽管DLSS的源码泄露,但其2.2版本的技术实力仍被公认为行业领先。 编辑观点:</对于内容创作者,我们尊重知识产权,呼吁所有厂商避免非法使用这些技术。对于大学生来说,这是一个了解行业领先技术的好机会,能够丰富学习内容,提升技能储备。尽管面临挑战,但英伟达的安全意识与持续投资表明,他们将继续在技术保护上保持领先地位。 此次事件提醒我们,网络安全是永恒的话题,每个行业参与者都需加强防护。希望大家从中获益,共同维护科技领域的健康发展。极智开发 | 解读英伟达软件生态 一切的基础CUDA
欢迎关注我的公众号 [极智视界],获取我的更多经验分享
大家好,我是极智视界,本文来介绍一下 解读英伟达软件生态 一切的基础CUDA。
邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接: t.zsxq.com/0aiNxERDq
CUDA,全称为 Compute Unified Device Architecture,是英伟达于 年推出的一个平行计算平台和应用编程接口 API 模型。CUDA 之于英伟达的重要性主要体现在下面几个方面:
所以,解读英伟达软件生态,必须要从 CUDA 说起。虽然 CUDA 再往下还有如 PTX 的指令集加速层级,但是PTX 的普及程度其实并不高,甚至可能很多朋友都没听说过 PTX,其实也算正常,因为基本上的 N 卡开发者,根本没必要接触到 PTX,把 CUDA 学好就足够够的了。
把 CUDA 作为标杆,似乎是很多 AI 芯片厂商 "共同的做法",比较有代表性的是升腾的 Ascend C、寒武纪的 Bang C,但是其实这几个之间有相似但又有不相似的地方。相似的地方在于不管是升腾还是寒武纪都想提供一套类似 CUDA 的可以充分调用自己 NPU 硬件加速的对外接口,提高客制化的灵活性。不相似的地方一方面在于我们是在学人家,很多接口其实是为了贴近 CUDA 的接口而进行的高级封装,毕竟大部分开发者其实已经形成了 CUDA 的开发习惯,这个时候让大家切换起来更加顺手的做法就是 "模仿",而要做这种程度的 "模仿" 势必要协调好硬件架构和软件接口的映射;不相似的另外一方面体现在软件生态的层次清晰度,这个拿升腾来专门说,升腾 Ascend C 的发布时间在 年 5 月 6 日,而反观英伟达 CUDA 的发布时间是 年。什么意思呢,很明显可以看到英伟达的软件生态是以 CUDA 为基础然后层层往上叠的,而升腾是先有了 CANN,先有了 MindSpore 这些 "高层建筑",然后往下才有了 Ascend C,这种软件生态的层次结构就没有那么清晰,当然这种说法也只是基于时间上的,这并不影响它在空间上还是具备不错的软件生态层次结构。
再回到 CUDA 本身,需要清楚的一点是,CUDA 其实一开始主要是面向优化计算密集型计算 (Compute-Bound),因为不管是最开始的通用科学计算还是后来的以 CNN 为主流的深度学习计算都是计算密集型,但是后来 Transformer 又逐渐流行,所以 CUDA 也是不断在 "与时俱进" 在做平衡、做兼顾,比如在 A 开始,CUDA 新增了从 L1 Cache 到 HBM Global Memory 数据直接异步拷贝的指令,其实也是在丰富自身对于访存密集型计算 (Memory-Bound) 的优化。
我之前写过挺多关于 CUDA 的分享,罗列一些,
CUDA 是一种硬件强相关的编程模型,要掌握好 CUDA,需要先看懂 GPU 硬件架构,从而映射到 CUDA 内存模型、线程模型上,这点跟 C 语言、跟 C++ 这类 "高级" 编程语言就很不一样,所以很多朋友会觉得 CUDA C 比较难写,特别是要写出高性能的 CUDA C,比较难。确实,这是事实,特别是对于写出高性能的 CUDA C,会涉及资源的高效调度,比如 Shared Memory、L1 Cache 等的调度;会涉及适应硬件架构超参的配置,比如 Thread、Block、Grid 等的配置。
总之,对于 CUDA 的深入学习,是一门 "稳挣不亏" 的 "买卖",原因不再过多赘述,主要体现在它的重要性上。
好了,以上分享了 解读英伟达软件生态 一切的基础CUDA,希望我的分享能对你的学习有一点帮助。
公众号传送
行代码完成批量缩星
在星空摄影中,处理大量照片以制作延时视频时,缩星成为了一项挑战。手动在PS中逐一操作或自编图像处理动作,耗时且效率低。本文提供了一种编程解决方案,利用免费工具starnet++ V2批量处理,实现快速批量缩星。
starnet++ V2能有效去除TIFF格式中的星星,只需调用程序即可实现批量操作。对于配备英伟达GPU的电脑,通过CUDA接口加速处理,可显著提升效率,显卡下速度提升可达5至6倍。
在使用代码前,请确保已下载并安装starnet++ V2(官网下载window 位版本),并将其放置于C盘特定目录。
附源代码(代码由AI自动生成),以下为使用方法概述:
首先将包含照片的文件夹命名为output,然后运行脚本nostar.py。脚本将自动处理output文件夹中的所有TIFF文件,将去星后的保存到output/starless目录下,无需人工干预。
处理效果显著,TIFF格式大小约为M,去星过程大约需要2分钟,此阶段主要利用CPU资源。若拥有英伟达显卡,可参考专门网页了解GPU加速方法。
最终成果如下,显示批量处理后的效果。
使用本文提供的方法,星空照片的缩星效率得到极大提升,尤其对处理大量时尤为明显。通过合理利用GPU资源,进一步加速了处理过程,提高了工作效率。值得注意的是,英伟达的CUDA库体积庞大,可能需要手动下载某些dll文件,以确保程序正常运行。