建筑课程网站网站关键词推广哪家好

张小明 2026/1/8 16:12:07
建筑课程网站,网站关键词推广哪家好,手机和pc网站,谷歌sem一、什么是GraphRAG#xff1f;小白也能懂的核心定义 GraphRAG#xff08;Graph-Based Retrieval-Augmented Generation#xff0c;基于图的检索增强生成#xff09;是微软于2024年7月2日开源的一种结构化、分层式RAG解决方案。不同于传统RAG的文本分块检索#xff0c;它核…一、什么是GraphRAG小白也能懂的核心定义GraphRAGGraph-Based Retrieval-Augmented Generation基于图的检索增强生成是微软于2024年7月2日开源的一种结构化、分层式RAG解决方案。不同于传统RAG的文本分块检索它核心通过构建「实体知识图谱」和预生成「社区摘要Community Summary」专门解决大模型回答全局性、关联性问题时的短板。简单来说GraphRAG的核心逻辑是用「图结构」把知识组织成“实体-关系-实体”的网络比如“李白-出生于-四川”再结合非结构化文档如论文、网页检索时不仅能找到相关文本还能通过图的连接性挖掘隐藏的语义关联最终让大模型输出更精准、更有逻辑的答案。对程序员和大模型初学者而言它是提升知识库问答能力的关键工具。二、和传统rag的区别在实施过程中还面临歧义查询或需要深入理解上下文的查询方面的困难。传统RAG在设计上是将文档分块以便进行检索然而这种方法忽略了这些块之间的上下文关系。如果意义或上下文跨越多个块就很难准确回答复杂的问题。全局问题和局部片段之间的匹配度低。例子传统rag无法推理出出现了几次西瓜三、知识图谱的引入知识图谱Knowledge Graph是一种以结构化形式描述现实世界实体及其关系的技术通过将数据组织为“节点-边-节点”的三元组构建出语义关联的网络。核心组成‌‌实体Entities‌表示具体或抽象的事物如“李白”“北京”。‌关系Relationships‌连接实体的边定义交互方式如“出生于”“首都”。‌属性Attributes‌描述实体的特征如“李白-字太白”“北京-人口2170万”。‌本体Ontology‌领域内的概念体系与关系约束如“城市-国家”间的“首都”关系。知识图谱构建核心将非结构化文本转化为结构化知识网络**。**GraphRAG会利用实体关系图、社区层级结构以及它们的sumamry、source chunk等各种维度的信息以向量和结构化的方式进行存储。Query分两种类型分别为Local Search和Global Search。四、工作原理GraphRAG 建立在微软之前使用图机器学习的研究和工具的基础上。GraphRAG 流程的基本步骤包含索引和查询两部分。索引l将输入语料库切分为一系列 TextUnit这些 TextUnit 作为其余过程的可分析单元并在我们的输出中提供细粒度的参考。l使用 LLM 从 TextUnits 中提取所有实体、关系和关键声明。l使用莱顿算法对图表进行层次聚类。l自下而上地生成每个社区及其组成部分的摘要。这有助于整体理解数据集。查询在查询时这些结构用于在回答问题时为 LLM 上下文窗口提供材料。主要查询模式包括l利用社区摘要对语料库的整体问题进行全局搜索推理。l本地搜索通过向邻居和相关概念展开来推理特定实体。步骤 1处理文本块将输入文档转换为 TextUnits。使用文本分段技术将文档进行分块文本块还作为实体和关系的来源被提取的图引用便于追溯到原始文本。步骤 2图提取在此阶段分析每个文本单元并提取图元素实体、关系和协变量。步骤 3图增强现在我们有了可用的实体和关系图我们希望了解它们的社区结构并用其他信息扩充该图。这分为两个步骤社区检测和图嵌入。这为我们提供了显式社区和隐式嵌入方法来理解图的拓扑结构。社区检测在此步骤中我们使用分层莱顿算法生成实体社区的层次结构。此方法将对我们的图应用递归社区聚类直到达到社区规模阈值。这将使我们能够了解图的社区结构并提供一种在不同粒度级别上导航和总结图的方法。图嵌入在此步骤中我们使用 Node2Vec 算法生成图中节点的向量表示。这将使我们能够理解图的隐式结构并提供额外的向量空间以便在查询阶段搜索相关概念。步骤 4社区总结我们希望基于社区数据并为每个社区生成报告。这让我们可以从多个粒度点对图表有一个高层次的了解。例如如果社区 A 是顶级社区我们将获得有关整个图表的报告。如果社区是较低级别的我们将获得有关本地集群的报告。生成社区报告在此步骤中我们使用 LLM 生成每个社区的摘要。这将使我们能够了解每个社区中包含的独特信息并从高级或低级角度提供对图表的范围理解。这些报告包含执行概述并引用社区子结构中的关键实体、关系和声明总结社区报告在此步骤中每个社区报告都会通过 LLM 进行总结以供摘要使用。社区嵌入在此步骤中我们通过生成社区报告、社区报告摘要和社区报告标题的文本嵌入来生成我们社区的向量表示。步骤 5文件处理在工作流程的这个阶段开始处理文档图谱核心步骤包括文本块图谱的创建和文档的向量化表示。将每个文档链接到第一阶段创建的文本单元创建文本块之间的上下文关系。这使我们能够了解哪些文档与哪些文本单元相关。使用文档切片的平均嵌入来生成文档的向量表示使我们能够理解文档之间的隐式关系并帮助我们生成文档的网络表示。步骤 6网络可视化实体关系图和文档图。查询过程深入解析本地搜索基于实体的推理。本地搜索方法通过将LLM 提取的知识图谱中的相关数据与原始文档的文本块相结合来生成答案。此方法适用于需要了解文档中提到的特定实体的问题。从知识图谱中识别出一组与用户输入在语义上相关的实体。这些实体可作为知识图谱的访问点从而提取更多相关详细信息例如连接实体、关系、实体协变量和社区报告。此外它还会从与已识别实体相关的原始输入文档中提取相关文本块。然后对这些候选数据源进行优先排序和筛选以适应预定义大小的单个上下文窗口该窗口用于生成对用户查询的响应。全局搜索全局搜索方法通过以 map-reduce 方式搜索所有 AI 生成的社区报告来生成答案。这是一种资源密集型方法但通常可以很好地回答需要了解整个数据集的问题例如本笔记本中提到的药材最重要的价值是什么。上图是一个经典的 MapReduce 原理图结构包含以下主要步骤包含全局 GraphRAG 流程的简单注解。将 input 的文件拆分成 splits由于测试用的文件较小所以每个文件作为一个 split并将文件按行分割。这一步由 mapreduce 框架自动完成。通过向量检索语义相关的社区将分割好的文件交给用户定义的 map 方法进行处理生成key,value对。生成社区和用户问题相关程度的分值和社区节点本身组成 MAP得到 map 方法输出的key,value对后shuffle 过程会把相同 key 值相同的放到一起。社区结果基于与问题的相关度做 Shuffle可以理解成分组Reduce 过程把 key 值相同 value 值累加得到新的key,value对并作为 word count 的输出结果。组内综合打分后排序过滤 0 分的结果然后由 LLM 生成回复五、样例基于文本《林黛玉初进荣国府》构建图谱解析 Graph RAG 的技术原理。5.1 构建索引第一步拆分文本块来源文档→ 文本块先把文档 token 化按照 token 数进行切分。具体 chunk 规格可以自定义更改。5.2 解析出元素实例文本块→ 元素实例-依赖LLM5.3 构建索引第三步总结元素摘要–依赖LLM5.4 检测出图社区community元素摘要 → 图社区5.5 构建索引第五步总结社区摘要图社区 → 社区摘要—通过 LLM 完成5.6 索引查询全局搜索社区摘要 → 社区答案 → 全局答案将社区摘要转化为回答用户查询的全局答案。该过程包括准备社区摘要、生成中间答案以及将最有帮助的答案整合成全局答案。社区摘要首先被随机打乱和分块然后通过映射步骤生成中间答案再通过归约步骤生成最终的全局答案。5.7索引查询本地搜索社区摘要 → 社区答案 → 全局答案系统会将所有实体的描述进行 embedding也就是转换成向量存储。当执行本地搜索时系统会将查询文本同样转换成向量表示。通过计算相似性找到与查询最接近的实体。找到相关实体后系统会通过图遍历来从这些实体出发进一步获取相关的关系如实体之间的连接和社区。六、GraphRAG的局限性计算资源需求高处理大规模图数据需要大量的计算资源。特别是在训练过程中需要存储和处理大量的节点特征以及它们之间的边信息这可能导致内存和计算能力的瓶颈。长距离依赖问题虽然注意力机制可以在一定程度上缓解这一问题但是图中的长距离依赖关系仍然难以完全捕捉到特别是对于那些跨越多个跳数hop的间接关系。过平滑Over-smoothing随着图神经网络层数的增加节点表示可能会变得越来越相似导致难以区分邻近节点。这对于分类任务来说尤其不利因为模型可能无法正确地将不同类别的节点区分开来。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】为什么要学习大模型我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年人才缺口已超百万凸显培养不足。随着AI技术飞速发展预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。大模型入门到实战全套学习大礼包1、大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通2、大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。3、AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。4、大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。5、大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。适用人群第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

python编程网站嘉兴小程序开发公司

1.1 互联网络概念1.2 网络边缘1.3 网络核心1.4 接入网和物理媒体1.5 互联网络结构与ISP1.6 分组延时、丢失与吞吐量1.7 协议层次与服务模型1.8 互联网历史1.9 总结

张小明 2026/1/8 12:42:38 网站建设

赣州网站制作公司科技网站哪个好

Vue 2 路由指南:从入门到实战优化 在开发单页应用(SPA)时,Vue Router 是必不可少的工具。它让我们能够在不刷新页面的情况下切换视图。今天我们就来根据学习笔记,系统地梳理一下 Vue Router 的核心用法,从…

张小明 2026/1/8 14:09:52 网站建设

北京建设有限公司信源官方网站杭州建设网页

从文本到数字人讲解视频:Linly-Talker自动化内容生成方案 在短视频与直播内容爆炸式增长的今天,企业、教育机构乃至个体创作者都面临着一个共同挑战:如何以更低的成本、更快的速度生产高质量的讲解类视频?传统方式依赖专业拍摄团队…

张小明 2026/1/8 14:23:57 网站建设

淘宝店铺装修做代码的网站wordpress怎么使用插件下载失败

自抗扰控制 (ADRC) Simulink 模型 包括跟踪微分器 非线性反馈控制器 扩张状态观测器 基于扩张状态观测器ESO的扰动估计与补偿控制方法最近在调试一个电机控制系统,被各种未知扰动折腾得够呛。偶然翻到韩京清教授的自抗扰控制(ADRC)方案&#…

张小明 2026/1/8 15:57:41 网站建设

永州网站建设哪里有谷歌推广外包

基于服务器的计算环境Beta部署全解析 在构建和部署基于服务器的计算(SBC)环境时,从试点项目扩展到Beta阶段是一个关键的步骤。Beta部署虽然在概念上仍然是试点,但它代表了将参与企业全面推广的用户和环境,对于发现和解决重大性能问题至关重要。 1. 扩展试点项目到Beta阶…

张小明 2026/1/8 16:08:11 网站建设