相关文章
Deepseek的RL算法GRPO解读
在本文中,我们将深入探讨Deepseek采用的策略优化方法GRPO,并顺带介绍一些强化学习(Reinforcement Learning, RL)的基础知识,包括PPO等关键概念。 策略函数(policy)
在强化学习中, a…
建站知识
2025/2/3 15:20:09
Kotlin函数式API
Kotlin函数式API
1.maxBy
val list listOf("Apple","Banana", "Orange","pear","Grape","Watermelon")
val maxLengthFruit list.maxBy {it.length}
println(maxLengthFruit)
2.map
集合中zhi的map函数是最…
建站知识
2025/2/3 16:08:22
网易云音乐歌名可视化:词云生成与GitHub-Pages部署实践
引言 本文将基于前一篇爬取的网易云音乐数据, 利用Python的wordcloud、matplotlib等库, 对歌名数据进行深入的词云可视化分析. 我们将探索不同random_state对词云布局的影响, 并详细介绍如何将生成的词云图部署到GitHub Pages, 实现数据可视化的在线展示. 介绍了如何从原始数据…
建站知识
2025/2/3 15:20:00
Visual Studio Code修改terminal字体
个人博客地址:Visual Studio Code修改terminal字体 | 一张假钞的真实世界
默认打开中断后字体显示如下: 打开设置,搜索配置项terminal.integrated.fontFamily,修改配置为monospace。修改后效果如下:
建站知识
2025/2/3 15:21:21
C++:PTA L2-003 月饼
月饼是中国人在中秋佳节时吃的一种传统食品,不同地区有许多不同风味的月饼。现给定所有种类月饼的库存量、总售价、以及市场的最大需求量,请你计算可以获得的最大收益是多少。
注意:销售时允许取出一部分库存。样例给出的情形是这样的&#…
建站知识
2025/2/3 15:21:32
pyautogui操控Acrobat DC pro万能PDF转Word,不丢任何PDF格式样式
为了将PDF转换脚本改为多进程异步处理,我们需要确保每个进程独立操作不同的Acrobat窗口。以下是实现步骤:
实现代码
import os
import pyautogui
import time
import subprocess
import pygetwindow as gw
from multiprocessing import Pooldef conver…
建站知识
2025/1/29 18:22:05