2019 年 5 月 – itewqq's blog

2019年5月21日2020年5月29日

强化学习入门: Q-Learning的python实现

强化学习入门: Q-Learning的python实现

观摩了微软俱乐部游戏组大佬的一个unity+tensorflow搞出来的的游戏AI之后对强化学习产生了点兴趣（其实说起来我当时进俱乐部面试的是游戏组最后给我整到软件了？？？），准备从小白开始学习一下强化学习和游戏里的AI。不过，查了很多资料之后直观感受是，国内这方面的优质资源真的很少，尤其是面向新手的。。。讲的乱七八糟，看的头皮发麻。经过一番扒拉后，找到了两个非常nice的国外大神做的入门教程，链接分别在

当我看到这两个Tutorial的时候感觉就像这位朋友的评论一样hhh

这里的代码用到的环境是openAI-gym里的Taxi-v2，这个游戏的界面长这样

简单说下这个图的含义：

总共5*5个空格，RGBY是四个表示乘客/目的地的位置继续阅读“强化学习入门: Q-Learning的python实现”

2019年5月4日2019年8月11日

[填坑] 一个私人视频站

忽然想起来自己还有一个一块钱一年买的垃圾.xyz域名，然后意识到我的一个月5美元的小鸡其实现在的存在很鸡肋，就想了想怎么能让它再多做点贡献。。。。

然后捣鼓了一天就整出来一个这样的垃圾视频站

目前pc端可以正常播放，这个资源采集的api更新的还挺快，权游第八季基本上当天更新的样子。。。

~~不过我还没做手机端适配，手机上现在会黑屏，不过我最近一段时间应该是没空做了emmmmm又得比赛又得学习又得准备考试，留了个坑等到有空填吧~~坑已填好，早上做了下手机端适配，顺便把m3u8播放器也整好了

►ACM题解
- ►×
- ►CF
- ►DP
  - ►TreeDP
  - ►优化DP
  - ►区间DP
  - ►合法性检验DP
  - ►数位DP
  - ►概率/期望DP
  - ►状压DP
  - ►线性DP
  - ►递推计数
- ►分治
- ►图论
  - ►2SAT
  - ►dfs
  - ►二分图
  - ►并查集
  - ►拓扑排序
  - ►最小费用最大流
  - ►最短路
  - ►欧拉路径/回路
  - ►连通分量
- ►坑
- ►字符串
  - ►AC自动机
  - ►Hash
  - ►Trie
  - ►后缀数组
  - ►后缀自动机
  - ►回文串
  - ►字符串模板
- ►思维
- ►数学
  - ►FFT
  - ►histogram
  - ►polya
  - ►博弈论
  - ►容斥
  - ►数论
  - ►母函数
  - ►组合数学
  - ►高斯消元&线性基
- ►数据结构
  - ►单调栈
  - ►单调队列
  - ►可持久化数据结构
  - ►带权并查集
  - ►线段树
- ►暴力
- ►杂
- ►构造
- ►树
  - ►LCA
  - ►树上倍增
  - ►树上差分
  - ►欧拉序
- ►比赛补题
- ►求解策略
  - ►meet in the middle
  - ►STL
  - ►STL/数据结构优化
  - ►二分
  - ►分块思想
  - ►分治
  - ►尺取法
  - ►搜索
  - ►目标转化
  - ►离线scheduling
  - ►贪心
- ►特殊姿势
  - ►仙人掌
  - ►生成树相关
- ►计算几何
  - ►圆
  - ►极角排序
►InfoSec
- ►Pwn
- ►Reverse
►Linux&Web
►OS
►Python&ML
- ►Reninforcement Learning
►奇怪的分享
►数学归纳法
►未分类
►随笔
- ►CTF