1.unity urp源码学习一(渲染流程)
2.vue 源码详解(三): 渲染初始化 initRender 、渲染渲染生命周期的平台平台调用 callHook 、异常处理机制
3.Vue源码解析(2)-$mount实现
4.游戏引擎随笔 0x20:UE5 Nanite 源码解析之渲染篇:BVH 与 Cluster 的源码源码 Culling
5.slate.js源码分析(一) —— slate渲染机制
6.UE4-Slate源码学习(六)slate渲染Part2-Paint控件绘制
unity urp源码学习一(渲染流程)
sprt的一些基础:
绘制出物体的关键代码涉及设置shader标签(例如"LightMode" = "CustomLit"),以确保管线能够获取正确的渲染渲染shader并绘制物体。排序设置(sortingSettings)管理渲染顺序,平台平台如不透明物体从前至后排序,源码源码重庆源码时代教学模式透明物体从后至前,渲染渲染以减少过绘制。平台平台逐物体数据的源码源码启用、动态合批和gpuinstance支持,渲染渲染以及主光源索引等配置均在此进行调整。平台平台
过滤规则(filteringSettings)允许选择性绘制cullingResults中的源码源码几何体,依据RenderQueue和LayerMask等条件进行过滤。渲染渲染
提交渲染命令是平台平台关键步骤,无论使用context还是源码源码commandbuffer,调用完毕后必须执行提交操作。例如,context.DrawRenderers()用于绘制场景中的网格体,本质上是执行commandbuffer以渲染网格体。
sprt管线的基本流程涉及context的命令贯穿整个渲染流程。例如,首次调用渲染不透明物体,随后可能调用渲染半透明物体、天空盒、特定层渲染等。流程大致如下:
多相机情况也通过单个context实现渲染。
urp渲染流程概览:
渲染流程始于遍历相机,如果是游戏相机,则调用RenderCameraStack函数。此函数区分base相机和Overlay相机:base相机遍历渲染自身及其挂载的Overlay相机,并将Overlay内容覆盖到base相机上;Overlay相机仅返回,不进行渲染操作。
RenderCameraStack函数接受CameraData参数,其中包含各种pass信息。添加pass到m_ActiveRenderPassQueue队列是关键步骤,各种pass类实例由此添加至队列。
以DrawObjectsPass为例,其渲染流程在UniversialRenderer.cs中实现。首先在Setup函数中将pass添加到队列,执行时,执行队列内的pass,并按顺序提交渲染操作。
vue 源码详解(三): 渲染初始化 initRender 、生命周期的调用 callHook 、异常处理机制
在Vue的公式源码详解软件下载源码解析中,本文着重于三个关键点:渲染初始化、生命周期调用及其异常处理机制。这些要素构成了Vue实例构建过程的核心,确保了应用在运行时的流畅性和稳定性。渲染初始化
在Vue实例初始化阶段,一系列关键属性和方法被设置,为后续的渲染工作做好准备。其中,$attrs和$listeners的使用虽然在普通开发场景中可能较少涉及,但在高阶组件中却发挥着重要作用。未来,将专门撰写一篇文章详细阐述其使用方法和场景。生命周期调用与callHook
在完成渲染初始化后,Vue实例开始执行生命周期钩子函数,以执行特定的初始化任务。这些生命周期函数以数组形式存储,形成“任务队列”,确保了函数按照预设顺序执行。调用callHook函数触发beforeCreate生命周期,该函数会遍历队列中的每个任务,并以当前组件实例为上下文执行这些函数。值得一提的是,在调用生命周期钩子时,Vue会暂时禁用依赖收集,以避免不必要的渲染操作。这一机制通过pushTarget和popTarget函数实现,确保在执行钩子函数后,状态能正确恢复。异常处理机制
Vue具有完善的异常处理机制,能够确保在遇到错误时,能够优雅地控制和处理。当组件内出现异常时,异常信息会沿组件链向上层组件传播,直至根组件。这一过程能够确保错误信息被妥善处理,避免了错误对应用整体性能的影响。通过配置组件上的errorCaptured属性,开发者可以选择阻止异常向上层组件传播,从而实现更精细的错误管理。 在Vue的生命周期管理和异常处理方面,callHook函数作为触发器,通过遍历生命周期队列执行相应任务。而invokeWithErrorHandling函数则负责处理每个任务函数的执行,确保即使在执行过程中出现异常,小游戏下载源码在哪也能通过适当的错误处理机制进行统一管理和控制。 综上所述,Vue的渲染初始化、生命周期调用和异常处理机制构成了其高效、灵活且安全的运行基础,为开发者提供了强大的工具集,以构建复杂的应用程序。通过深入理解这些核心部分,开发者能够更有效地利用Vue的特点,实现高效、稳定的应用开发。Vue源码解析(2)-$mount实现
在上一节中,我们了解到Vue实例的创建过程中,构造函数会执行_init()函数,其中关键步骤是调用vm.$mount(vm.$options.el),这标志着实例已开始挂载到DOM。$mount是Vue渲染的核心函数。
本章节我们将深入探讨Vue的渲染过程,但会跳过一些细节,以便在后续章节中详细剖析。首先,理解Vue的两种构建方式是关键:独立构建(包含template编译器)和运行时构建(不包含模板编译器)。独立构建支持服务端渲染,而运行时构建体积更小。
接下来,我们开始分析Vue源码。$mount方法的实现与平台和构建方式相关,这里我们关注运行时版本。在src/platforms/web/entry-runtime-with-compiler.js中,$mount被添加到Vue原型上,它接收el参数,可能是字符串或DOM元素。
当el为字符串时,会通过query方法将其转换为DOM节点。然后判断el不能为body或html,以防止意外覆盖。如果没有render函数,会根据template生成render,同时处理多模板形式。getOuterHTML函数获取el的内容和DOM。
$mount最终调用mount函数,这个过程涉及核心的mountComponent方法,生成虚拟Node并实例化渲染Watcher,其回调中调用updateComponent更新DOM。外卖订购小程序源码这部分在core/instance/lifecycle.js中,会检查render函数并处理特殊情况,如未定义或使用template语法的runtime-only版本。
updateComponent是渲染和更新的核心函数,由Watcher(在'src/core/observer/watch.js'定义)在数据变化时调用。Watcher在初始化时执行回调,当数据更新时也执行。整个过程体现了观察者模式,$mount中调用updateComponent的过程涉及template到render的转换,以及初次渲染或数据变更时的调用。
虽然我们已经概述了$mount的流程,但关于render函数的编译步骤并未深入讲解。编译过程包括添加web平台特性、解析template为AST、优化节点、生成render函数字符串并缓存。下一节将详细剖析这五个步骤的源码实现,敬请期待。
游戏引擎随笔 0x:UE5 Nanite 源码解析之渲染篇:BVH 与 Cluster 的 Culling
Nanite遵循的设计理念是三角形的绘制数量超过像素数量就是一种浪费。UE5中的Nanite技术在EA版本发布后揭开了面纱,其渲染性能令人惊叹,本文尝试从源码层面解析Nanite的实现技术,详细讲解Nanite的实现细节,以供开发者参考。
Nanite在GPU端流程如下:
1. **Nanite::Streaming**:异步上传Cluster渲染数据,基于上一帧回读的Cluster Page Request数据进行。
2. **Nanite::InitContext**:初始化Culling上下文的GPU相关数据。
3. **Nanite::CullRasterize**:执行剔除与光栅化,包含生成深度目标、执行基础渲染以及生成阴影等步骤。
4. **Nanite::EmitDepthTargets**:根据Visibility Buffer生成深度相关的Buffer,如Scene Depth、Stencil、Velocity、Material Depth等。
5. **Nanite::BasePass**:使用Visibility Buffer和Cluster相关Buffer输出Deferred Rendering所需的G-Buffer。
6. **Nanite Shadows**:生成阴影所需的深度信息,仅包含InitContext和CullRasterize两步。
7. **Nanite::Readback**:回读PersistentCull pass产生的Cluster Page Request数据。
本文重点解析CullRasterize步骤中的PersistentCull pass源码。
为了在GPU上高效执行Culling,Nanite预生成了BVH(Bounding Volume Hierarchy),每个节点最多包含8个子节点,叶节点存储实际的轻博客源码htmlCluster索引数据。但要在GPU中实现高效的层次遍历且负载均衡并非易事,设计的不合理会导致性能下降、GPU线程闲置。
UE5的Nanite在GPU端实现了一种高效的遍历机制,性能高且负载均衡,GPU在整个过程中几乎满负荷运行。BVH和Cluster数据结构与存储方式都围绕着高效遍历和负载均衡的目标设计。
**关键Buffers数据结构**:
- **CandidateNodesAndClusters**:存储候选BVH Node和Cluster信息的全局Buffer,内存布局包括待处理的Cluster Group总数、所有候选Cluster Packed数据和所有候选BVH Node Packed数据。
- **MainAndPostPassPersistentStates**:存储Culling过程中的状态数据,包括用于写入BVH Node的读写偏移、Cluster读写偏移等。
- **InstanceCull**:执行对象实例级别的可见剔除,将可见的BVH Root Node存储在CandidateNodesAndClusters中。
- **PersistentClusterCull**:充分利用GPU线程,避免空闲,分为Node和Cluster处理两个阶段,通过组内线程同步和多线程并行处理,实现负载均衡。
**BVH Node Culling解析**:
1. 每组线程计算需要处理的候选BVH节点,通过原子操作统计有效节点数量,并在处理完成时切换至Cluster Culling。
2. 通过组内线程索引计算节点和子节点的索引,执行子节点的Culling处理,同时通过队列管理新产生的候选节点。
3. 优化候选Cluster存储,减少GPU Buffer写入开销。
**Cluster Culling解析**:
1. 处理存储在队列中的候选Cluster,通过编码和同步机制查找需要处理的Cluster。
2. 执行真正的Culling逻辑,包括可见性判断、硬件或软件光栅化等。
3. 将可见的Cluster写入全局缓冲,根据光栅化类型顺序存储,并在Post Pass中再次执行Culling流程。
解析至此,UE5的Nanite技术通过高效的GPU算法和数据结构实现了强大的渲染性能,使得百万面的高精度模型在老显卡上也能实现流畅运行。UE5团队的设计与工程实现能力令人敬佩,其精神和勇气引领了行业技术的前沿。通过深入源码学习,开发者可以深入了解先进的设计思想和工程实现方法,提升自己的技术实力。
slate.js源码分析(一) —— slate渲染机制
富文本编辑器中的可见内容主要由文档内容和光标两部分组成。本文将详细介绍Slate在文档内容和光标方面的渲染机制。
Slate文档的结构包含元素(Element)和文本(Text)两类节点。这些节点类似于DOM树,可以嵌套结构。用户在元素或文本上添加扩展属性,以提供渲染节点所需的数据。
文档的截图与对应的Slate值之间存在对应关系,这种关系帮助开发者直观理解文档的渲染过程。
Slate组件树类似于DOM树,对应于Slate值的数据结构。文档区域的顶部负责更新选择数据、文档树内容,并提供DOM事件API(如onKeydown和onClick)。
节点数据被渲染为HTML,允许用户自定义渲染过程,通过renderElement方法实现。根据装饰的不同,文本会被分割成相应数量的leaf。
文本内容的渲染则通过renderLeaf方法来控制文本内容的样式。
Slate值的更新逻辑利用React技术,将文档数据实时渲染为DOM结构。当contenteditable为true的元素被修改时,会触发beforInput事件,通过监听这一事件,实现文档内容的实时同步。
在使用Slate时,输入法问题是一个常见挑战。本文将简要介绍输入法的工作原理及其常见bug,并分析解决方法。
正常键盘输入仅触发beforInput事件,而使用输入法时,除了beforInput事件,还会触发Composition事件。这三个事件分别对应输入法开始、内容更新和结束的过程。在输入法输入期间,如果实时修改文档内容,会导致与输入法冲突。因此,在CompositionUpdate期间,Slate Value不会做任何更新,直至CompositionEnd时再进行更新。遇到报错情况时,通常是因为在CompositionStart时文档内容被删除,而在CompositionEnd时找不到对应的DOM节点,引发错误。解决办法是在CompositionStart时更新文档值以避免冲突。
解决输入法问题的一个方案是fork源码。通过这种方式,可以确保Slate与输入法协同工作,提高用户体验。
Slate Selection数据结构与DOM Selection类似,由锚点(anchor)和焦点(focus)两个点组成。了解详细信息可以参考MDN Selection文档。
Selection的更新机制依赖于React完成渲染。在每次Selection值发生变化时,会在useEffect中更新DOMSelection。同时,监听window.document上的selectionchange事件以更新Slate Selection值。
后续计划继续深入探讨Slate源码分析,包括历史记录机制、从Slate 0.升级到0.的实战指南、数据模型、序列化机制、normalize机制等,敬请期待。
最后,附上招聘广告。百度如流团队正面向北京、上海、深圳等地招聘,提供丰富的岗位选择,欢迎有意者进行内推。
UE4-Slate源码学习(六)slate渲染Part2-Paint控件绘制
上一篇文章介绍了绘制一个SWindow的初期步骤,即计算整个UI树的控件大小,为绘制做准备。文章随后深入探讨了绘制流程的第二步,即执行FSlateApplication::PrivateDrawWindows()后,开始调用SWidget::Paint()函数,每个控件随后实现其虚函数OnPaint()。
在这一过程中,绘制参数被封装在FPaintArgs中,作为Paint和OnPaint过程中的关键引用参数。FSlateRHIRenderer与FSlateDrawBuffer是继承自FSlateRenderer的类,作为FSlateApplicationBase的全局变量,在构造时创建。在绘制过程中,通过GetDrawBuffer()函数可获取到FSlateDrawBuffer对象。
FSlateDrawBuffer实现了Slate的绘制缓冲区,内部封装了FSlateWindowElementList数组,用于存储多个SWindow下的绘制元素列表。每个SWindow通过AddWindowElementList()返回一个元素列表。
FSlateWindowElementList负载了SWindow内的所有图元信息,内部封装了FSlateDrawElement的数组,包含Cached和Uncached元素,以及SWindow的指针和用于渲染的批处理数据FSlateBatchData。
FSlateDrawElement是构建Slate渲染界面的基本块,封装了UI树节点控件需要渲染的相关信息,如渲染变换、位置、大小、层级ID、绘制效果等,以及后续渲染阶段需要的相关数据。
在Paint流程中,处理当前传入的SWindow和ChildWindows,首先判断窗口是否可见和是否最小化,然后从参数封装的OutDrawBuffer中获取WindowElementList。调用SWindow的PaintWindow()函数开始绘制窗口,并最终返回所有子控件计算完的最大层级。接着,子窗口递归绘制。
PaintWindow()函数在绘制窗口时,首先调用SetHittestArea()设置点击区域,HittestGrid会判断窗口大小是否改变,若不变则仅更新窗口在屏幕中的位置。构造FPaintArgs参数后,将其封装到FSlateInvalidationContext中。
FSlateInvalidationRoot类的PaintInvalidationRoot()函数可以作为控件树的根节点或叶子节点(SInvalidationPanel),构建快速路径避免每次绘制都计算大小和Paint函数,有利于优化。本篇文章主要分析正常慢速路径调用流程,优化相关将另文分析。
PaintSlowPath()函数从SWindow开始调用Paint()函数,并定义LayerId从0开始作为参数,进行实际的绘制相关计算。
Paint()函数首先处理裁剪、透明度混合、坐标转换等代码。若SWidget包含NeedsTick掩码,则调用Tick函数,我们在日常开发中通过蓝图或lua使用Tick函数时即调用到这里,通过SObjectWidget::Tick调用到UUserWidget::NativeTick供实现Tick。构造FSlateWidgetPersistentState PersistentState作为SWidget的变量,表示Paint时的状态。
PersistentState.CachedElementHandle将当前SWidget存储到FSlateWindowElementList中的WidgetDrawStack数组中。
更新FPaintArgs中的父节点参数和继承可点击测试参数,判断点击测试状态,然后将当前SWidget添加到点击测试中。调用虚函数OnPaint,由控件自己实现。
OnPaint()函数参数包括绘制参数引用、几何体、裁剪矩形、缓冲元素列表、层级、控件风格、父节点状态等。最后处理重绘标签、延迟绘制相关内容、UpdateWidgetProxy()根据缓存句柄更新快速路径中需要处理标记设置为Volatile不稳定状态的SWidget。
虚函数OnPaint()由子类自己实现,本文列举了SImage、SButton、SCompoundWidget和SConstraintCanvas的OnPaint()示例代码学习。
在SImage中,简单判断Brush是否存在以及BrushDrawType的类型,然后调用FSlateDrawElement::MakeBox将控件添加到缓冲区元素列表中。
SButton继承自SCompoundWidget,GetBorder()根据当前按钮状态返回ui中设置的Enabled、Press、Hover、Disabled等状态的Brush。
SCompoundWidget作为合成节点,有且只能有一个子节点,且在Paint时强制将子节点的LayerId+1,同时SCompoundWidget可以单独设置混合颜色和透明度,影响子节点。
SConstraintCanvas作为SWidget的基类对应UMG中常用的UCanvasPanel,通过ArrangeLayeredChildren()对孩子进行层级排序,并根据孩子的层级是否相同存储bool值在ChildLayers中。遍历所有孩子,判断是否开启新层级,递归调用Paint函数,最后返回最大层级。
SConstraintCanvas::ArrangeLayeredChildren函数中,获取设置bExplicitChildZOrder,表示可以将同层一次渲染,有利于提高渲染器批处理。对所有孩子排序,排序规则为FSortSlotsByZOrder。遍历所有孩子,判断可见性掩码、计算偏移、锚点、位置、拉伸缩放等,封装成FArrangedWidget存储到ArrangedChildren中,用于OnPaint时有序遍历。判断每个孩子ZOrder是否相同,相同则bNewLayer为false,大于LastZOrder则将bNewLayer设置为true,最终存储到ArrangedChildLayers中,用于OnPaint函数判断是否将layerId+1。
FSlateDrawElement::MakeBox()函数在OnPaint之后调用,将绘制控件的相关信息通过创建FSlateDrawElement绘制元素对象,添加到SWindow管理的FSlateWindowElementList元素列表中。创建Payload用于存储贴图等相关信息,根据控件Paint过程中的参数调用Element.Init初始化绘制元素,得到为该控件绘制创建的FSlateDrawElement对象。
总结整个Slate绘制流程的第二步,我们没有分析快速处理和优化细节,而是按照正常绘制流程分析代码。通过从PaintWindow开始遍历整个控件树,处理每个空间节点的Paint、OnPaint函数,最终目的是给每个控件创建一个FSlateDrawElement对象,存储渲染线程绘制所需的相关信息,并添加到FSlateWindowElementList中。理解了整个调用流程,整个过程较为清晰,本文基于UE4版本4..2。