皮皮网
皮皮网

【最新金色版萝卜影视源码】【makeblock源码研究】【源码代取快递】sop流程 源码_sop流程软件

时间:2024-12-24 08:49:40 来源:贝游棋牌源码

1.sop���� Դ��
2.废墟图书馆安吉拉模型来啦!流流程附详细微调思路和体验地址
3.私域运营必知的50个专业名词
4.品质ECO、程源ECR、软件PEN、流流程PCN、程源MPL、软件最新金色版萝卜影视源码SOP是流流程由那些英文组成的,具体指什么意思...

sop流程 源码_sop流程软件

sop���� Դ��

       鸿蒙系统与安卓系统同等级别,二者均基于L内核,程源开源信息表明,软件6月1日已公开全部源代码供下载使用。流流程

       内核结构方面,程源LiteOS专为小型设备设计,软件当前L内核作为过渡使用。流流程一旦L内核成功转变为LiteOS,程源鸿蒙系统将实现全面升级。软件

       至于安卓系统,其过渡阶段依赖大量基于L内核的应用程序。未来,鸿蒙系统将致力于构建完善自身生态系统,逐步淘汰同样基于L内核的安卓系统及其衍生产品,实现自身的全面替代。

废墟图书馆安吉拉模型来啦!makeblock源码研究附详细微调思路和体验地址

       项目介绍

       本项目是书生·浦语大模型实战营的一个大作业,旨在使用大模型微调技术实现角色扮演。目前项目已迭代第一个版本,实现了利用《废墟图书馆》对话语料微调模型,从而对角色“安吉拉”进行角色扮演,在对话风格上模仿的十分贴合人物。

       更多示例见github仓库主页。已开源模型权重和Demo体验地址。项目基于书生·浦语全工具链进行开发,并在internstudio平台完成微调,具体可参考如下流程图,可以作为微调任意游戏角色的一个SOP。

       角色语料搜集

       游戏这种载体在搜集语料上有天然的优势。最开始搜集数据有想过对《废墟图书馆》进行解包,后面发现Wiki已经有大神把所有剧情对话都整理好了,简直感动。首先观察Wiki,可以发现每个对应一个剧情对话超链接,链接对应一个剧情场景。点进去并查看网页源码可以发现对话是包含在div中嵌套的span块里的文本,针对这些组织形式写出对应的源码代取快递爬虫语句即可(也可以交给GPT4)。其他游戏的Wiki应该也是相似的(例如原神、明日方舟等),因此可以总结出以下SOP:根据以上逻辑,代码如下(完整代码见github仓库)。由于以前做经济实证收集数据对Xpath比较熟所以使用该方法,也可以换成bs4或是其他解析库。

       数据格式统一

       这块就怎么方便怎么来,只要体现是“什么角色说了什么话”,因此存为表格型数据是比较理想的,也方便加入更多字段(例如命运石之门这种时间跳跃的作品,可能需要加入一个世界线字段)。对于小规模数据可以直接存CSV文件,如果数据量过大(比如上千了)可以考虑使用sqlite、MySQL这类数据库进行管理,最后只要方便存取即可。

       构建数据集

       在构建微调数据集这块,借鉴了凉宫春日计划[1]和一位国外教授实现自己数字分身的案例[2],主要思路为寻找安吉拉两次对话之间的内容,拼接为一个大 Input。[3]但若是安吉拉第一次出现,则将前面 n 条语料拼接(n过大会被去除,资金席位源码避免超出token数)。例如:拼接为:优点:缺点:对于如何切分多轮对话:需要寻找话题的断开点,可以使用gpt(但个人感觉难度很大)或者人工筛选。但就目前来说,单轮模式已经可以很好的学到人物的说话风格。数据量需要多少:根据LIMA: Less Is More for Alignment[4]中的结论,高质量的条左右的数据就能达到不错的效果,本项目目前使用条对话数据进行微调。

       算力平台与环境配置

       一般云服务器是带有torch、transformers等库的,其他环境配置可以参考xtuner[5]仓库给出的教程。

       模型选型

       现在大模型层出不穷,对于如何选择用于微调角色扮演的模型,个人认为有两种思路(假设已经根据算力资源选择了对应的参数量):

       大模型中文榜单

       可以根据文本生成相关的参数,在HuggingFace LLM Leaderboard[6]这类评测结果榜单上搜索模型。当然这里推荐一个国内的模型评测网站OpenCompass[7],可以直观看出各种模型的评测结果。

       业界口碑

       当然有时也不能迷信榜单,因为不排除模型可能针对榜单进行过优化。这时候就可以搜索对应模型,查看相关从业者在业务上对各种模型的源码查找图片评价,并且越火的模型对应的教程也越多,有效避免踩坑!

       模型下载

       2. 对于国外服务器,HuggingFace是最佳选择,感受风一般的下载速度吧!

       模型微调

       如何微调模型以及微调一个多大的模型取决于持有的算力资源。1.8B模型可以全量微调,7B模型往上可以使用QLoRA。这块微调可以使用xtuner,主要思路如下:

       模型部署与量化

       先总结一下,到目前为止,我们已经有了微调后的模型,该模型已经相当于从HuggingFace上直接下载好的模型了,随后就可以使用HuggingFace的AutoModel系列读取并进行chat。当然这里也可以使用LMDeploy的模型部署服务,其支持开箱即用的命令行对话、Gradio Demo展示和Api服务,思路主要如下:其会在同路径下生成一个workspace 文件夹,随后就可以直接进行对话了。命令行对话:lmdeploy chat turbomind ./workspaceGradio Demo:lmdeploy serve gradio ./workspace API服务:

       关于模型量化,之前尝试对7B模型进行int4量化,效果非常不理想,基本是在胡言乱语。或许是对更大参数量如B模型进行量化,效果才会更好。

       关于部署和量化,具体可以见我之前写的笔记:

       模型评测

       角色扮演的要求自然是要贴合角色表现,不能ooc,下面给出几种参考的评测自己微调后的模型表现方法:

       人工评测:拿给熟悉该人物或作品的人试试,聊几轮就知道像不像(最直接的方法)

       大模型评测:例如在RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models[]这篇论文中,作者使用了GPT模型来评测不同模型的表现,参考prompt如下

       论文指标评测:目前也有一些研究角色扮演的论文,里面的实验阶段会提出一些参考评测指标。例如在论文CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models []中,就提出了以下指标

       不足之处

       1. 客观事实不清晰:由于只使用了对话记录进行微调,模型欠缺对整体世界观、人际关系网的把握(L公司即脑叶公司,是安吉拉以前工作的地方)

       2. 模型幻觉依然存在,虽然大部分时候不会出现严重幻觉,但模型对实体的认知还是有一定问题

       3. 多轮对话能力不足:主要源于构建数据集时仅考虑了单轮对话,没有加入一定的多轮对话数据,理想的话应该是1:1左右的比例?

       项目前瞻

       1. 加入RAG:针对缺乏客观事实,可以考虑将Wiki内容和设定集内容作为知识库,在每次对话时进行一次检索,保证模型不会出现一问三不知的情况。

       2. 加入配音:《废墟图书馆》原作中每个角色是有配音的(韩语),其中安吉拉的配音为李多恩[]老师(配过崩铁的佩拉),可以考虑使用其游戏语音训练一个text2video模型,增加角色扮演的沉浸感

       3. 变为跑团,多角色聊天:针对安吉拉的角色扮演SOP也同样适用其他模型,后续可以考虑做成一个pipeline把其他角色也微调好,最后做成一个聊天室的架构。当前考虑聊天室结构如下,若采用RAG+system_prompt的zero-shot角色扮演,则可以只用一个大模型,则可使用一个统一的类管理所有的对话记录,每次集成之前的n个角色对话作为prompt,并将对应的system_prompt和history发给第n+1个人物。

       但针对需要微调的模型,只能对每个角色加载对应的模型,这样n个角色(不包括自己)的聊天室需要消耗加载n个模型的显存。考虑算力约束,或许得用1.8B模型代替7B模型。

       最后

       很高兴书生·浦语团队丰富的教学文档和友善的团队,让大家能够实现各种各样的角色扮演计划。作为从年一直看Project Moon成长到现在的月计人,看到模型效果时实在是有一种由衷的感动。如果你喜欢本项目可以来Github点一个star哦,当然目前国内也有不少优秀的角色扮演项目,例如“凉宫春日计划”就做的相当厉害。本篇也是开学伊始对寒假末尾做的一些事情的总结,也希望在新学期也能坚持下去吧。

私域运营必知的个专业名词

       å¦‚今私域相关人才进入了供不应求的状态,不少企业开始设置专门的岗位,私域运营也成为了招聘市场中的“香饽饽”。但是想要成为一名优秀的私域运营并不容易,需要具备多方面的综合能力。当然最基础的是认知能力,尤其是相关的专业名词都必须要了解和掌握。所以下面我就列举了个私域相关的专业名词,帮助你总结学习,查漏补缺,后面还会持续更新!.私域流量私域流量是指企业可以自由利用,无须付费,又能随时触达,被沉淀在自有app、公众号、个人微信、微信群等相对私密渠道的用户集群。.公域流量公域流量是和私域流量相对的一个概念。简而言之就是一个公共区域的流量,是大家共享的平台,比如微博、抖音、小红书等平台。.商域流量商域流量是平台从公域流量划出来,以付费为主要分配标准的流量。本质上,商域流量还是公域流量,只是分配流量的标准变成了以付费为主。例如抖音信息流广告等。.超级用户超级用户首先一定是企业产品的重度用户,对产品的需求频率很高;其次,他们在未来一段时间内,有明确意愿持续消费企业的产品和服务,目前主要体现在愿意花钱成为企业的付费会员上。在这个定义中有两个关键点,一是重度用户;二是有明确的持续消费意愿。.LTV(lifetimevalue)可以理解为用户的生命周期价值,简单来说就是:用户从开始接触私域到离开离开的整个过程。可以分为:引入期、长大期、稳定期、衰退期、流失期。.增量市场/存量市场增长市场它是指潜在的、还没被竞争对手教育和抢占的市场,也可以说是空白市场。而存量市场,是已经被看见、被教育、被开发的市场,它的出现经历了一段“从有到优”的过程。.用户画像用户画像简单理解就是用户信息标签化,例如通过用户年龄、性别、消费习惯、地域等信息,把用户抽象成标签化的模型,以便进行更有针对性地进行推广或用户管理。.用户分层用户分层是建立用户标签体系、用户分层体系和分层转化策略,实现精细化运营用户的目的,更是一种对用户进行标签划分的方法。.用户留存率这个指标是用来衡量一段时间后用户留下来的比例。常用户私域社群的留存率计算,一般会跟踪次日留存、三日留存、七日留存以及天留存。.私域流量运营五步法则1)IP化:建立品牌人格,拉近用户距离2)连接:设计长期价值,吸引用户关注3)促活:创造用户触点,保持互动曝光4)分层:建立用户标签,实现精准营销5)复购:引导用户需求,创造二次成交.触点营销用户接触到我们的每一个点,这些点就叫触点。触点营销,就是通过包装这些每一个点,让用户有产生关注、有感到我们的价值等等,最终促使用户进行购买和转化。.用户行为路径用户行为路径分析是一种监测用户流向,从而统计产品使用深度的分析方法。用户访问页面、小程序等都会形成行为路径。.拉新拉新是指拉来新用户,最直接的指标是新增用户数。在私域中常被指于社群拉新、门店拉新等渠道新增用户。.促活/唤醒简单理解就是通过某些方式达到活跃用户的目的,通常在社群中里会进行用户促活,让用户重新关注品牌。.千人千面常用于广告或内容营销,通过个性化标签以及内容推荐系统实现不同的人看到不同的内容,从而实现精准营销。.SOP(StandardOperatingProcedure)即标准作业程序,就是将某一事件的标准操作步骤和要求以统一的格式描述出来,用来指导和规范日常的工作。例如社群sop就是建立社群运营工作的标准化,每一个步骤细节、每一个动作的时间节点、负责人等等,都需要提前准备。.私域裂变私域裂变以私域用户为基础刺激分享,获取用户社交关系链中的用户,可以充分利用用户的拉新价值,并且获客成本较低,有利于实现快速的用户增长。例如社群中进行红包裂变玩法。.复购率复购率是是根据消费者对某一产品或服务的重复购买次数计算出来的比率。复购率能够反映出消费者对该产品或服务的忠诚度,比率越高则忠诚度越高,反之则越低。.转化率转化率指在一个统计周期内,完成转化行为的人数占私域总人数的比率。计算公式为:转化率=(转化人数/总人数)×%。.私域沙漏模型沙漏模式是一个完整的良性的闭环。从用户的吸引、用户转化、用户留存、用户复购再到分享裂变,是一个完整的客户关系管理的过程。只有这样,企业才能有沉淀客户,让客户产生复购,最终形成品牌。.AARRR模型AARRR模型是私域流量运营中最为常见的模型之一。从获客、激活、留存、变现、传播5个流程帮助商家从公域中挖掘新流量,建立自己的“私域流量池”。.RFM模型RFM是衡量用户价值常用的工具,R(Recency)表示客户最近一次交易与当前时间的间隔,F(Frequency)表示客户的交易频率,M(Monetary)表示客户的交易金额。以这三个指标为基础,可将用户分为八大客户类型,根据不同的客户类型采取相应的措施,促进企业决策。.帕累托分层模型帕累托分层模型又叫定律模型,即%的用户为企业创造%的价值,运营者需要花费%的精力去服务%的优质用户。常用于用户分层,所以需要企业优先找到这%的客户,并服务好他们。.埋点是数据分析中的一种常用的数据采集方法,有全埋点、代码埋点、可视化埋点几种方式,代码埋点又分前端埋点,后端埋点。.A/B测试A/B测试常用于裂变海报的测试。在同一时间维度,为了测试某因素对结果的影响,以此因素为变量,其他因素为定量进行测试,以找到结果最佳的变量刻度。.免费会员用户获取会员身份,并不需要额外花钱。这种会员模式门槛低,覆盖广,经常被设计成“长大型会员”模式,我们最常见的就是“积分制”。根据你累积的消费行为,来区分不同的会员等级和权益。.付费会员用户需要花钱获取会员身份,而且是限时的。这种会员模式门槛较高,主要针对一部分粘性高、要求高、复购高,且有一定消费力的用户。这又可以细分为付费购买消费资格(比如Costco、山姆会员店等),以及付费购买权益(比如京东PLUS、天猫VIP等)。.储值会员“储值会员”本质是一种消费金预存行为,钱还是顾客的,只是提前存在商家这边,我承诺以后会用来消费。预存的目的,是为了返现、折扣等价格优惠,而非为了某种权益或服务额外支付溢价。.种子用户这类用户通常是产品的重度使用者,而且乐于反馈和分享给他周边的人使用。例如品牌通过社群与种子用户进行沟通交流,挖掘需求,他们可以更好地进行传播。.GMV(GrossMerchandiseVolume)即商品交易总额,是成交总额(一定时间段内)的意思。例如社群当月的GMV是万元。.ROI(ReturnonInvestment)意思是投资回报率,计算公式:投资回报率(ROI)=利润/投资总额×%。.DAU(DailyActiveUser)日活跃用户数量,常用于反映网站、互联网应用或网络游戏的运营情况,网站通常用日UV来衡量,DAU常用于APP,常见的还有WAU周活跃和MAU月活跃。.ARPU(averagerevenueperuser)指每个用户的平均收入,是运营商用来测定其取自每个最终用户收入的一个指标。做数据分析的时候,ARPU一般指客单价,但并不反映最终的利润率。.API(ApplicationProgrammingInterface)应用程序接口,用来提供应用程序与开发人员基于某软件或硬件得以访问的一组例程,而又无需访问源码,或理解内部工作机制的细节。.CRM(CustomerRelationshipManagement)客户关系管理,通常也代表客户关系管理系统,企业用来管理与客户之间的关系。.SCRM(SocialCustomerRelationshipManagement)即社会化的客户关系管理,或是基于社交媒体的客户关系管理。.ERP(EnterpriseResourcePlanning)企业资源计划,是指建立在信息技术基础上,集信息技术与先进管理思想于一身,以系统化的管理思想,为企业员工及决策层提供决策手段的管理平台。.SaaS(Software-as-a-Service)软件即服务,提供给客户的服务是运营商运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问,如浏览器。消费者不需要管理或控制任何云计算基础设施,包括网络、服务器、操作系统、存储等等,可以理解为开通账号密码就可以使用。.MCN(Multi-ChannelNetwork)即多频道网络,是一种新的网红经济运作模式。这种模式将不同类型和内容的PGC(专业生产内容)联合起来,在资本的有力支持下,保障内容的持续输出,从而最终实现商业的稳定变现。当下多为挖掘孵化网络红人、KOL、IP形象,并且为其设计发展路线,最终进行落地变现。.PV(pageview)即页面浏览量,通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标之一。.UV(UniqueVisitor)即唯一访问量,是指访问某个站点或者点击某条新闻的不同IP地址的人数。.SEM(SearchEngineMarketing)搜索引擎营销,是一种网络营销形式,是全面且有效地利用搜索引擎进行网络营销和推广。.seo(SearchEngineOptimization)利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名,搜索引擎优化做的越好,网页排名越高。.SMO(SocialMediaOptimization)社会化媒体优化,通过社会化媒体,在线组织和社交网站获得公共传播的一整套方案。.KPI(KeyPerformanceIndicator)关键绩效指标法,是企业绩效考核的方法之一,其特点是考核指标围绕关键成果领域进行选取。.OKR(ObjectivesandKeyResults)即目标与关键成果法,是一套明确和跟踪目标及其完成情况的管理工具和方法,通过O(Objectives目标)来进行拆分出KR(KeyResults关键结果),下一级的O是上一级的KR,最终保证大家目标方向的统一。.UGC(UserGeneratedContent)用户生成内容,即用户将自己原创的内容通过互联网平台进行展示或者提供给其他用户。知乎可以说是最典型的UGC平台之一,内容由用户创造,而非平台为用户创造。.PGC(Professionally-generatedContent)专家创造内容,用来泛指内容个性化、视角多元化、传播民主化、社会关系虚拟化。.LBS(LocationBasedServices)基于位置的服务,是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。.MOT(MomentofTruths)MOT是一个关键指标,是对客户导向的具体衡量,因为对客户而言,他只会记住那些关键时刻,用来帮助企业落实以用户为中心的理念。这次先分享到这里,下次更新继续补充。/完《超级用户增长》作者,专注客户经营,助力企业增长。

品质ECO、ECR、PEN、PCN、MPL、SOP是由那些英文组成的,具体指什么意思...

       1. ECO:工程变更命令(Engineer Change Order),是指在工程实施过程中,当发现工程资料存在问题时,由工程部门发出的变更指令。

       2. ECR:工程变更请求(Engineer Change Request),是指在工程实施过程中,当生产部门等发现工程资料存在问题时,向工程部门提出的资料变更请求。一旦工程部门同意,将发出ECO以确认变更。

       3. PEN:专业人士(Professional Executive Network),指的是一个由专业人士组成的网络。

       4. PCN:工艺变更通知(Process Change Notification),涉及工艺的变更,并通知相关方面。

       5. MPL:Mozilla Public License,是一种软件许可证,由Netscape的Mozilla小组于年初为其开源软件项目设计。MPL许可证旨在平衡开发者对源代码的需求和他们通过源代码获得的利益。

       6. SOP:标准作业指导书(Standard Operation Procedure),是一份详细说明企业内部操作流程的文件,用于指导员工的标准操作,确保工作质量。

       品质管理(Quality Management)涉及科学技术内在信息状态的定型,包括人力、人才、产品、服务等企业要素。通过科学技术手段提升内在科技含量,并进行信息化披露,以接受质量标准的评估。具体来说,产品品质是指产品固有的特性,这些特性能够满足客户的需求。

       品质管理方法包括:

       1. 掌握5M1E品质变异要素。

       2. 运用QC-STORY解决品质问题。

       3. 应用SQC统计技术。

       4. 使用QC七大手法。

       5. 其他常用品质管理方法,如实验计划、抽样计划、SPC统计制程管制、APQP先期质量策划等。

更多内容请点击【休闲】专栏