1.深入 Python —— 切片(Slice)原理
2.SRS(simple-rtmp-server)流媒体服务器源码分析--HLS切片
3.Cesium地形切片--CTB(cesium-terrain-builder)填坑指南
4.DEM数字高程数据切片Cesium
5.PyTorch源码学习系列 - 2. Tensor
深入 Python —— 切片(Slice)原理
在深入探讨 Python 切片原理之前,电影电影我们先检验一下对切片的源码源码用基本理解。请尝试回答以下几个问题:
不借助Python解释器,切片切片能迅速给出答案的电影电影,说明你对切片掌握得不错。源码源码用许多人可能对其中一个问题不完全确定。切片切片macd绿色柱子源码没关系,电影电影本文将从底层实现角度全面掌握切片机制,源码源码用学完之后,切片切片再回头来看这些问题就不再是电影电影难题。
让我们从字节码层面开始。源码源码用这段字节码分为两部分,切片切片前半部分构建列表 a,电影电影后半部分通过 a 切片得到列表 b。源码源码用与本文主题相关的切片切片关键字节码指令在后半部分,它们是:
BUILD_SLICE
在执行 BUILD_SLICE 之前,解释器将切片的两个关键参数 start 和 stop 压入栈,然后执行 BUILD_SLICE 指令。传入参数为 2,这意味着构建的切片对象只包含两个参数,即没有指定第三个参数 step。
这段代码简明,首先根据传入参数个数判断切片是否包含 step,如果有,它会成为最后一个被压入栈的参数。接下来,从栈中取出 start 和 stop,并将这三个参数传入 PySlice_New 函数创建切片对象,go 源码 vendor再将此对象放回栈中。
现在,让我们进一步探索切片对象的内部结构:
现在明白了吗?当我们对序列进行切片时,解释器会根据传入的 start、stop、step 创建切片对象,该对象与要切片的原序列之间没有直接关联。
Python 提供内置函数 slice 来创建切片对象:
这两种获取切片方式等价:
BINARY_SUBSCR
这个指令称为二元下标,即 a[0] 的方式是一元下标。那么,通过切片对象对序列进行切片与通过索引对序列取值是否有关联?继续查看源码:
从栈中取出的对象是前面构建的切片对象,而 container 对象则是要切片的原列表,它们被传给了 PyObject_GetItem 函数。
答案显而易见,二元下标即切片通过 PyObject_GetItem 函数处理,它同样用于处理一元下标!
PyObject_GetItem 实现了多态性,根据要切片的对象不同,调用对象的特定函数以进行不同的处理。列表的处理将在后续讨论,现在我们需要理解,序列的下标可以是整数或切片对象,它们的处理接口相同。
切片参数的处理涉及 start、stop 和 step 的值,这些值可以是整数,可以是maclose指标源码负数,start 和 stop 可能超过列表长度。特殊 step、stop 值决定了切片结果,这些处理在 PySlice_GetIndicesEx 函数中完成。理解切片行为的核心在于理解这个函数的逻辑。
记住以下几点:
深入列表切片处理:
切片适用于所有序列对象:列表、字符串、元组。我们日常最常使用的列表切片就在这里进行深入探讨,其他两种处理方式也类似。
通过查看列表对象源码,我们发现, o->ob_type->tp_as_mapping->mp_subscript 和 list.__getitem__ 指向同一个函数——list_subscript,列表切片正是在这里处理的:
其中的 list_slice 函数在 step 等于 1 时简化版:
总结:
本文从源码层面深入分析了切片对象、对 start、stop、step 值的处理,以及虚拟机生成列表切片的全过程。理解 Python 对 start、stop、step 的处理逻辑后,文章开始处的问题将不再能给出答案。
SRS(simple-rtmp-server)流媒体服务器源码分析--HLS切片
SRS流媒体服务器支持rtmp和hls协议,满足PC和移动端直播需求。
.m3u8文件作为播放控制文件,记录地址与播放参数;.ts文件存储视频内容。
SRS源码中,java 源码地图HLS处理框架在RTMP消息处理后执行。重点关注的是HLS切片处理。
进入on_video()函数,主要执行以下步骤:
1. 获取并处理H编码信息SPS和PPS。
2. 检测视频压缩编码格式为H,否则退出。
3. 执行RTMP抖动矫正(具体操作略)。
4. 进行HLS切片处理。
HLS切片处理涉及两个主要部分:
1. 首次或.ts文件时间溢出时,执行reap_segment()函数,负责.m3u8和.ts文件的创建、打开与关闭。.m3u8文件在ts文件写入完成后,一次性写入播放参数等信息。
2. 其他时间,直接进入flush_video()函数,负责ts流编码与.ts文件写入。
ts流编码包含多个步骤:根据音视频类型获取PID、TS编码、PAT帧与PMT帧(TS流前两个包)以及音视频数据编码。
总结:SRS源码中的HLS处理流程覆盖了.m3u8与.ts文件的管理、编码与切片,确保了视频流的正确播放。
学习资源:可查阅相关教程与文章,了解FFmpeg/WebRTC/RTMP/NDK/Android音视频流媒体开发的高级知识。
学习地址:[学习地址]
Cesium地形切片--CTB(cesium-terrain-builder)填坑指南
面临全中国Cesium地形数据制作需求,原计划使用cesiumlab进行操作,libcap源码分析但处理数千张DEM数据时,面临性能和数据管理问题,导致项目效率低下。
随后发现CTB(cesium-terrain-builder)工具,能有效提升处理速度,且不占用个人办公资源,便于数据处理与后期发布。然而,使用过程中遇到编译问题,GDAL环境部署后,CTB的cmake编译不通过,经排查后发现是GDAL版本与CTB需求不符,调整至GDAL-2.4.4后,问题解决。
在验证CTB使用效果时,发现cesium无法直接使用CTB输出的gzip压缩地形文件,为了解决瓦片压缩问题,通过修改CTB源代码,将CTBZFileOutputStream改为CTBFileOutputStream,完成对输出文件格式的调整,使cesium能直接利用输出结果进行数据展示。
对于多数据同时处理问题,采用Python脚本按顺序处理文件夹下数据,并结合GDAL生成虚拟数据集(vrt)的方法,以简化层.json文件的合并过程,提升工作效率。最终,通过此方案,不仅成功解决了技术难题,还有效提升了项目处理效率,实现自动化与标准化流程。
DEM数字高程数据切片Cesium
在处理DEM数字高程数据切片时,首要解决的环境问题涉及基础环境配置、GDAL版本选择与错误处理。确保使用官方推荐的GDAL版本(2.2),遵循正确顺序安装依赖(sqlite3、tiff、proj),避免遇到如FlushCache override错误等问题。服务代理设置中,需注意GZIP压缩可能导致的RangError错误,推荐不修改源码,以保持性能稳定。
在Cesium场景中加载地形时,通过获取DEM数据、安装切片工具(CTB)并发布服务的流程实现。对于获取DEM数据,推荐使用地理空间数据云,提供国内米精度的数字高程信息。Cesium-terrain-builder作为切片工具,适配Cesium需求,支持加载切片成果至Cesium场景中。
对于小白用户,采用Docker容器安装Cesium-terrain-builder更为便捷,确保版本与仓库分支(master-quantized-mesh)匹配,支持Cesium两种地形格式。安装前,需确保基础环境(如Debian最小环境)与工具准备(版本选择为3.4.2,避免更新至3.8引发错误)。
源码安装时,下载最新源码后需切换至特定分支或应用PR以确保兼容性。编译正式切片服务时,配置响应头中GZIP以优化数据传输。同时,处理跨域访问问题,确保CORS设置,以实现服务的广泛可用性。
PyTorch源码学习系列 - 2. Tensor
本系列文章同步发布于微信公众号小飞怪兽屋及知乎专栏PyTorch源码学习-知乎(zhihu.com),欢迎关注。
若问初学者接触PyTorch应从何学起,答案非神经网络(NN)或自动求导系统(Autograd)莫属,而是看似平凡却无所不在的张量(Tensor)。正如编程初学者在控制台输出“Hello World”一样,Tensor是PyTorch的“Hello World”,每个初学者接触PyTorch时,都通过torch.tensor函数创建自己的Tensor。
编写上述代码时,我们已步入PyTorch的宏观世界,利用其函数创建Tensor对象。然而,Tensor是如何创建、存储、设计的?今天,让我们深入探究Tensor的微观世界。
Tensor是什么?从数学角度看,Tensor本质上是多维向量。在数学里,数称为标量,一维数据称为向量,二维数据称为矩阵,三维及以上数据统称为张量。维度是衡量事物的方式,例如时间是一种维度,销售额相对于时间的关系可视为一维Tensor。Tensor用于表示多维数据,在不同场景下具有不同的物理含义。
如何存储Tensor?在计算机中,程序代码、数据和生成数据都需要加载到内存。存储Tensor的物理媒介是内存(GPU上是显存),内存是一块可供寻址的存储单元。设计Tensor存储方案时,需要先了解其特性,如数组。创建数组时,会向内存申请一块指定大小的连续存储空间,这正是PyTorch中Strided Tensor的存储方式。
PyTorch引入了步伐(Stride)的概念,表示逻辑索引的相对距离。例如,一个二维矩阵的Stride是一个大小为2的一维向量。Stride用于快速计算元素的物理地址,类似于C/C++中的多级指针寻址方式。Tensor支持Python切片操作,因此PyTorch引入视图概念,使所有Tensor视图共享同一内存空间,提高程序运行效率并减少内存空间浪费。
PyTorch将Tensor的物理存储抽象成一个Storage类,与逻辑表示类Tensor解耦,建立Tensor视图和物理存储Storage之间多对一的联系。Storage是声明类,具体实现在实现类StorageImpl中。StorageImp有两个核心成员:Storage和StorageImpl。
PyTorch的Tensor不仅用Storage类管理物理存储,还在Tensor中定义了很多相关元信息,如size、stride和dtype,这些信息都存在TensorImpl类中的sizes_and_strides_和data_type_中。key_set_保存PyTorch对Tensor的layout、device和dtype相关的调度信息。
PyTorch创建了一个TensorBody.h的模板文件,在该文件中创建了一个继承基类TensorBase的类Tensor。TensorBase基类封装了所有与Tensor存储相关的细节。在类Tensor中,PyTorch使用代码自动生成工具将aten/src/ATen/native/native_functions.yaml中声明的函数替换此处的宏${ tensor_method_declarations}
Python中的Tensor继承于基类_TensorBase,该类是用Python C API绑定的一个C++类。THPVariable_initModule函数除了声明一个_TensorBase Python类之外,还通过torch::autograd::initTorchFunctions(module)函数声明Python Tensor相关的函数。
torch.Tensor会调用C++的THPVariable_tensor函数,该函数在文件torch/csrc/autograd/python_torch_functions_manual.cpp中。在经过一系列参数检测之后,在函数结束之前调用了torch::utils::tensor_ctor函数。
torch::utils::tensor_ctor在文件torch/csrc/utils/tensor_new.cpp中,该文件包含了创建Tensor的一些工具函数。在该函数中调用了internal_new_from_data函数创建Tensor。
recursive_store函数的核心在于
Tensor创建后,我们需要通过函数或方法对其进行操作。Tensor的方法主要通过torch::autograd::variable_methods和extra_methods两个对象初始化。Tensor的函数则是通过initTorchFunctions初始化,调用gatherTorchFunctions来初始化函数,主要分为两种函数:内置函数和自定义函数。