尝试使用新的python包管理器uv
最近在网上冲浪时(🚽玩📱),发现很多人说抛弃垃圾conda,不要再用龟速pip,改用uv。总得来说,uv的优势的速度极快,劣势是成熟度和生态还不如pip和conda。
下面的测试均在windows中进行。
安装
最简单的安装方式是使用pip安装(🤣)。当然,还有其他的安装方法,但是咱们怎么简单怎么来。
pip install uv
包管理
uv 支持大部分的pip命令,只要在原本的pip命令前加上uv就可以了。
比方说,安装一个包
uv pip install <package>
也能通过requirements.txt安装
uv pip install -r requirements.txt
卸载包
uv pip uninstall <packa...
错义突变Z评分
数据库
错义突变Z评分表示对于给定基因,观察到的错义突变(单个氨基酸取代)的预期数量的偏差,其中正值表示错义突变缺失,负值表示错义突变富集。
需要将这个内容注释到结果表中中,首先从UCSC下载该数据库。
wget https://hgdownload.soe.ucsc.edu/gbdb/hg38/gnomAD/pLI/missenseByTranscript.v4.1.bb
这个数据库提供了转录本水平的Z-scores,依据的GnomAD版本是v4.1。
也可以下载基因水平的Z-scores,但依据的GnomAD版本是v2.1.1,相对较旧。
wget https://hgdownload.soe.ucsc.edu/gbdb/hg38/gnomAD/pLI/missens...
部署FLUX和Forge
AI发展真的很快,一年多的时间,Stable Diffusion的热度已被FLUX打了下去。尝试一下现在的破电脑(RTX 2070,8G VRAM,16G RAM)能不能本地部署,感觉有点悬。不过可以找大佬优化了的模型进行部署。
安装Forge
首先安装Forge这是Stable-Diffusion-webui的分支版本,支持FLUX的使用。
下载目前的最新版本,然后解压到合适的路径。
然后需要运行一次 update.bat进行初始化,升级和下载相关的依赖库。
然后就可以运行run.bat打开webui了。
部署FLUX
查了点资料,8GB 的显存可用的模型版本有NF4、GGUF、FP8等。因为我的显卡是20系,无法使用NF4,可以使用FP8,最后综合考虑使用GGUF。
...
Docling简单使用
日常工作中,会有从docx文件或者pdf文件中提取信息的需求。一般的,在提取docx时,我是用的是python-docx库;而提取pdf时,使用的是PyPDF2。
新的工具Docling,号称可以支持读取多种流行的文档格式(PDF、DOCX、PPTX、图像、HTML、AsciiDoc、Markdown),并支持导出为Markdown和JSON格式。还支持OCR识别扫描件的pdf(需额外安装EasyOCR等OCR引擎)。
Docling的安装
pip install docling
docx提取
import json
from docling.document_converter import DocumentConverter
source = "test.docx"
...
MNV/MNP合并
肿瘤的变异检测一般用到Mutect2,但Mutect2对MNV的检出支持并不好,而EGFR基因的19del突变是经常有MNV的情况出现,这种19del通常被拆分为一段del和一个SNV,一般会用transvar、mutalyzer来人工重注释,显然会引起解读同事的不满( ̄ヘ ̄)。
WhatsHap
WhatsHap是一款单倍型组装软件,通过输入reference.fa、bam和vcf可以评估单倍型,然后给vcf补充上一个PStag来记录评估的结果。
whatshap phase \
--indels \
--reference ref.fa \
-o sample.phase.vcf \
sample.vcf \
sample.bam
bgzip sample.phas...
NAS折腾笔记
国庆节基本折腾好中年男人三件宝之一的NAS了。首先思考一下本身的需求,基本是储存照片和电影,还有就是作为家中的文件共享中心。因此,否决前期考虑的All In Bomb软路由一体机方案,科学的事情让需要科学的设备自己做。目前家里的网络环境有动态公网IPV6,没有IPV4。
硬件设备是绿联DX4600,升级到UGOS Pro后,自带的影音软件体验尚可,相册则是一坨💩。
为了规避一些麻烦,前期进行了以下措施进行叠甲:
1,买了一个腾讯云的小服务器(28元一年买不了上当),买了一个域名绑定这个云服务器中并且完成了备案;
2,将域名托管到赛博活佛Cloudflare,配置好了WAF策略避免攻击;
3,使用二级域名来DNS解析AAAA到NAS的IPV6中,仅HTTPS可访问,并且开启小黄...
WES性别预测的奇技淫巧
进行WES时,需要将样本性别作为一个质控参数,因此要对数据进行性别预测。注意,任何方法的准确率都不能达到100%。
通过CNV方式预测
cnvkit中包含了性别预测的方式,具体是与基线进行比较获得cnr文件后,对cnr文件使用
cnvkit.py sex sample.cnr -o output.txt
可在进行CNV检测时同步进行。
通过SRY基因
这个应该是最简单的,直接统计比对到SRY基因区域的reads数,根据reads数的数目来预测性别。前期先对若干数量的已知性别样本进行统计,就大概可以获得一个判定的阈值。
Chrom
Start
End
Name
Y...
我需要转到峰谷电价?
开始柴米油盐,需要抠抠搜搜!居民用电是默认阶梯电价的,需要转换到峰谷电价需要申请,让电网来更换峰谷电表。
查了下自己的用电量,当我只保留冰箱、净水机、NAS、各种待机设备时,每天大概耗电3.5 kWh(保留设备都正常在线,然后出门溜达一天算出来的。妈啊怎么这么多)。正常的话,每天大概用电10 kWh(也不知道正不正常)。
以一个月30天计算(当然,周末的用电曲线是不同的,但是影响不会太大),我每月用电量大概是300 kWh。再经过研究自己的作息,发现我在10-12,14-19这个用电高峰根本就不在家!现在可以算一下究竟是阶梯电价划算还是峰谷电价划算了。
阶梯计费
以南方电网 - 广州的电价为例(注意时效,夏天和非夏天电价不同)。
档位
...
共计 247 篇文章,31 页。