自托管部署Stirling-PDF
我在对PDF进行操作时,一般流程是通过Google搜索PDF处理,然后用在线的工具。譬如[ilovepdf](https://www.ilovepdf.com/zh-cn),又譬如[SmallPDF](https://smallpdf.com/cn)。使用这些在线工具的风险是数据与第三方服务器进行交互,另外也存在只能在线使用的劣势。
批量下载NCCN指南
使用playwright批量下载NCCN英文指南。~~后续我想对指南建立向量知识库,然后使用DeepSeek来批量整理其中的靶向用药位点信息。~~注意,该行为违反NCCN的最终用户许可,千万不要做。下面也只是一个测试代码,我也不知道有没有用🤪。