相关文章
大模型训练之加速篇 -attention优化【MQA-> flashAttention】
MQA (multi query attention)
Fast Transformer Decoding: One Write-Head is All You Need MQA 是 19 年提出的一种新的 Attention 机制,其能够在保证模型效果的同时加快 decoder 生成 token 的速度。 那到底能提升多少的速度呢,我们来看论文中给出的结…
建站知识
2025/1/23 18:15:45
Idea操作Git合并另一个分支的部分提交
现有master、dev两个分支,master有提交1、2、3、4、5、6、7,dev是从master提交的3拉出来的分支(Reset Current Branch to Here…,Mixed模式),有提交1、2、3,现在的需求是dev分支只需要合并maste…
建站知识
2024/12/15 5:25:20
ChatGPT技术原理
目录
一、Tokenization
二、Transformer模型
三、预训练
四、微调
五、Beam search
总结 自从OpenAI的ChatGPT在2022年底横空出世以来,这款大型语言模型在各种任务中都展现了惊人的性能,包括问答、对话、文本生成等。ChatGPT以其卓越的性能和高效的…
建站知识
2024/11/13 22:25:20
minikube搭建k8s
环境:centos7,docker18
minikube搭建k8s
说明
minikube是最接近原生kubernetes的本地单机版集群,支持大部分kubernetes功能,用于学习和开发k8s。支持Linux、Windows、Mac 官网安装文档
安装前提
一台物理机或者虚拟机&#x…
建站知识
2024/12/18 12:48:20
Tomcat 下部署 jFinal
1、检查web.xml 配置,在 tomcat 下部署需要检查 web.xml 是否存在,并且要确保配置正确,配置格式如下。
<?xml version"1.0" encoding"UTF-8"?>
<web-app xmlns:xsi"http://www.w3.org/2001/XMLSchema-i…
建站知识
2024/11/5 10:10:38
【java】【SpringBoot】【四】原理篇 bean、starter、核心原理
目录
一、自动配置
1、bean加载方式(复习)
1.1 加载方式-xml方式生命bean
1.2 加载方式-xml注解方式声明bean
1.3 注解方式声明配置类
1.4 FactoryBean
1.5 proxyBeanMethod属性
1.6 使用Import注解导入 1.7 使用上下文对象在容器初始化完毕后注…
建站知识
2024/12/7 18:00:11
vue - vuex实现持久化存储
vuex持久化存储
vuex默认是刷新就会将厂库数据重置的,那么我们利用本地存储实现vuex本地持久化存储? 代码如下:
封装本地存储的方法:
// 个人信息持久化存储封装// 约定一个 通用 的键名(本地存储键名)
…
建站知识
2025/1/23 1:36:16
麒麟信安参编的两项云计算团体标准发布!助推云计算产业高质量发展
近日,由中国电子技术标准化研究院主办,全国信标委云计算和分布式平台分委会、全国信标委云计算标准工作组、云计算标准与应用工业和信息化部重点实验室承办的第十二届云计算标准和应用大会在北京举办。本次大会上,麒麟信安起草参编的《信息技…
建站知识
2024/10/2 23:59:57