4 有用
1 下载

遗传变异分类数据集

文件列表(压缩包大小 3.59M)

免费

概述

遗传变异分类数据集

介绍

  • ClinVar是一个公共资源,包含有关人类遗传变异的记录。

  • 临床实验室将这些变体(通常是人工地)按良性,可能良性,不确定性,可能致病性和致病性分类。当临床医生或研究人员试图解释该变体是否对给定患者的疾病产生影响时,具有冲突分类的变体会引起混乱。

  • 目的是预测ClinVar变体是否具有冲突的分类。在这里作为二进制分类问题提出,其中数据集中的每个记录都是遗传变异。

内容

  • 包含以下三类:
  1. 可能是良性/良性
  2. VUS
  3. 可能是致病的/致病的
  • 冲突的分类已分配给CLASS列。它是变体是否具有冲突分类的二进制表示形式,其中0表示一致的分类,而1表示冲突的分类。

  • 由于此问题仅与具有多个分类的变体有关,因此从只有一次提交的原始ClinVar .vcf中删除了所有变体。

数据集转载自 https://www.kaggle.com/kevinarvai/clinvar-conflicting

理工酷提示:

如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈

评论(0)

0/250