【毫秒源码】【arcar源码】【openpose源码】SP源码全称-皮皮网

【毫秒源码】【arcar源码】【openpose源码】SP源码全称

时间：2025-01-24 13:47:03 分类：综合

1.软件sp和cc是源码什么意思
2.Androidä¸dipï¼dpï¼spï¼ptåpxçåºå«è¯¦è§£
3.[转]Megatron-LM源码系列(八)： Context Parallel并行

SP源码全称

软件sp和cc是什么意思

软件SP是一种软件产品的简写，是源码英文单词“service pack”的缩写。它是源码一组微软公司推出的升级补丁，用于提供操作系统的源码安全性和稳定性。通常情况下，源码软件SP会把多种更新、源码毫秒源码修补、源码补丁和安全修复程序打包成一个升级文件，源码用户可以通过安装该文件来更新其计算机上的源码操作系统。

软件CC是源码一些软件程序经过编译后生成的可执行文件的后缀名。在编译时，源码源代码会被转化为计算机可识别的源码二进制代码，并将其转换为可执行文件。源码这些可执行文件最终会使用软件CC的源码后缀名来命名。常见的源码软件CC有C++、Java、Python等，arcar源码这些编译器通过转换源代码为机器码，使得程序具有了运行的能力。

软件SP和CC在计算机软件领域中具有非常广泛的应用。软件SP通过打包多种更新和修复程序，可以快速成批更新操作系统，提高了计算机的安全性和稳定性，减少了计算机遭受黑客攻击和崩溃的几率。而软件CC则是openpose源码编译器生成的可执行文件后缀名，是许多编程语言的标志。程序员们在编写代码时，需要使用到相关软件CC将源代码编译成可执行文件，便于程序的调试和运行。

Androidä¸dipï¼dpï¼spï¼ptåpxçåºå«è¯¦è§£

åº¦éåä½å«ä¹

dip: device independent pixels(è®¾å¤ç¬ç«åç´ ). ä¸åè®¾å¤æä¸åçæ¾ç¤ºææ,è¿ä¸ªåè®¾å¤ç¡¬ä»¶æå³ï¼ä¸è¬æä»¬ä¸ºäºæ¯æWVGAãHVGAåQVGA æ¨èä½¿ç¨è¿ä¸ªï¼ä¸ä¾èµåç´ ã

dp: dipæ¯ä¸æ ·ç

sp: scaled pixels(æ¾å¤§åç´ ). ä¸»è¦ç¨äºåä½æ¾ç¤ºbest for textsizeã

inï¼è±å¯¸ï¼ï¼é¿åº¦åä½ã

mmï¼æ¯«ç±³ï¼ï¼é¿åº¦åä½ã

åº¦éåä½çæ¢ç®å¬å¼

å¨androidæºç åTypedValue.javaä¸ï¼æä»¬çå¦ä¸å½æ°ï¼

ä»£ç å¦ä¸:

public static float applyDimension(int unit, float value,

DisplayMetrics metrics)

{

switch (unit) {

case COMPLEX_UNIT_PX:

return value;

case COMPLEX_UNIT_DIP:

return value * metrics.density;

case COMPLEX_UNIT_SP:

return value * metrics.scaledDensity;

case COMPLEX_UNIT_PT:

return value * metrics.xdpi * (1.0f/);

case COMPLEX_UNIT_IN:

return value * metrics.xdpi;

case COMPLEX_UNIT_MM:

return value * metrics.xdpi * (1.0f/.4f);

}

return 0;

}

è¯¥å½æ°åè½ï¼æ¯æååä½æ¢ç®ä¸ºåç´ ã

metrics.densityï¼é»è®¤å¼ä¸ºDENSITY_DEVICE / (float) DENSITY_DEFAULT;

metrics.scaledDensityï¼é»è®¤å¼ä¸ºDENSITY_DEVICE / (float) DENSITY_DEFAULT;

metrics.xdpiï¼é»è®¤å¼ä¸ºDENSITY_DEVICE;

DENSITY_DEVICEï¼ä¸ºå±å¹å¯åº¦

DENSITY_DEFAULTï¼é»è®¤å¼ä¸º

æ®px = dip * density / ï¼åå½å±å¹å¯åº¦ä¸ºæ¶ï¼px = dip

æ ¹æ® google çå»ºè®®ï¼TextView çåå·æå¥½ä½¿ç¨ sp ååä½ï¼èä¸æ¥çTextViewçæºç å¯ç¥Androidé»è®¤ä½¿ç¨spä½ä¸ºåå·åä½ãå°dipä½ä¸ºå¶ä»åç´ çåä½ã

[转]Megatron-LM源码系列(八)： Context Parallel并行

原文链接： Megatron-LM源码系列(八)： Context Parallel并行

Context Parallel并行(CP)与sequence并行(SP)相比，核心差异在于SP只针对Layernorm和Dropout输出的activation在sequence维度进行切分，而CP则进一步扩展，对所有input输入和所有输出activation在sequence维度上进行切分，hbasemerge源码形成更高效的并行处理策略。除了Attention模块外，其他如Layernorm、Dropout等模块在CP并行中无需任何修改，因为它们在处理过程中没有涉及多token间的交互。

Attention模块之所以特殊，是因为在计算过程中，每个token的maxlength源码查询(query)需要与同一sequence中其他token的键(key)和值(value)进行交互计算，存在内在依赖性。因此，在进行CP并行时，计算开始前需要通过allgather通信手段获取所有token的KV向量，反向计算时则通过reduce_scatter分发gradient梯度。

为了降低显存使用，前向计算阶段每个GPU仅保存部分KV块，反向阶段则通过allgather通信获取全部KV数据。这些通信操作在特定的rank位置（相同TP组内）进行，底层通过send和recv等操作实现allgather和reduce_scatter。

以TP2-CP2的transformer网络为例，CP并行的通信操作在Attention之前执行，其他则为TP通信。AG表示allgather，RS表示reduce_scatter，AG/RS表示前向allgather反向reduce_scatter，RS/AG表示前向reduce_scatter反向allgather。

TP2对应为[GPU0, GPU1], [GPU2, GPU3]，CP2指的就是TP组相同位置的rank号，即[GPU0, GPU2], [GPU1, GPU3]。CP并行类似于Ring Attention，但提供了OSS与FlashAttention版本，并去除了冗余的low-triangle causal masking计算。

LLM常因序列长度过长而导致显存耗尽（OOM）。传统解决方法包括重计算或扩大TP（tensor parallel）大小，但各自存在计算代价增加或线性fc计算时间减少与通信难以掩盖的问题。CP则能更高效地解决这一问题，每个GPU处理一部分序列，同时减少CP倍的通信和计算量，同时保持TP不变，使得activation量也减少CP倍。性能优化结果展示于图表中，用户可通过指定--context-parallel-size在Megatron中实现CP。

具体源码实现以Megatron-Core 0.5.0版本为例进行说明。

参考资料：

[链接]

上一条：人贩余华英获死刑，受害家庭：“几十年的辛酸，终于清楚了”
下一条：市场监管行风建设在行动

【毫秒源码】【arcar源码】【openpose源码】SP源码全称

编辑推荐