我想将这个文件与dbsnp (file2)数据转储进行比较,并与dbSNP转储中存在的Chr和Pos col进行匹配。匹配后,将获取相应的rsid。如何从dbSNP (file2)获取整个数据集(file1 = 650k行)的rsid #Program to compare Chr and Pos of a sample with dBSNP andimport pandas as pd
df1 = pd.read_csv("v2_infi_chr_pos.csv",sep='\t'
这些位置对应于基因组中的位置,以及Affymetrix (和dbSNP)给它们的一个(或两个)标识符。Affy SNP ID dbSNP RS ID Chromosome Chromosome Start然后我有了另一个只有下面是第二个表;它没有Affymetrix/dbSNP标识符。如何筛选出这些记录?