UCI⼼脏病数据集HeartDiaDataSet
在UCI机器学习库中,Heart Dia Data Set⼀共包含4个关于⼼脏病诊断的数据库。
其中数据分别来源⾃:
1. Cleveland Clinic Foundation (cleveland.data)
2. Hungarian Institute of Cardiology, Budapest (hungarian.data)
3. V.A. Medical Center, Long Beach, CA (long-beach-va.data)
2017年2月16日
4. University Hospital, Zurich, Switzerland (switzerland.data)blank是什么意思>star farming
每个数据库都包含有76个属性,但是所有已发布的实验都只引⽤了其中14个属性的⼦集。特别是,克利夫兰数据库(cleveland.data)是迄今为⽌ML研究⼈员使⽤的唯⼀数据库。
在中有两个数据集。
其中,procesd.cleveland.csv是从下载的数据集
数据属性说明:
1)age-年龄
2)x-性别 (1 =男性; 0 =⼥性)
3)cp-胸痛类型(4个值,值1:典型的⼼绞痛,值2:⾮典型⼼绞痛,值3:⾮⼼绞痛,值4:⽆症状)
4)trestbps-患者⼊院时的静息⾎压(单位:mm Hg)
5)chol-⾎清胆固醇⽔平(单位:mg / dl)
6)fbs-空腹⾎糖(> 120 mg / dl ,1=真;0=假)
weightless7)restecg-静息⼼电图结果(值0:正常,值1:有ST-T波异常(T波倒置和/或ST升⾼或降低> 0.05 mV),值2:根据Estes的标准显⽰可能或确定的左⼼室肥⼤)
8)thalach-达到的最⼤⼼率
9)exang-运动引起的⼼绞痛(1 =是; 0 =否)
10 )oldpeak-运动相对于休息引起的ST压低
felixstowe
11)slope-最⾼运动ST段的斜率,(值1:上坡,值2:平坦,值3 :下坡)
12)ca-萤光显⾊的主要⾎管数⽬(0-3)
13)thal-⼀种称为地中海贫⾎的⾎液疾病(3=正常;6=固定缺陷;7=可逆缺陷)
14)target- 患者是否患有⼼脏病。它是从0(不存在)到4的整数值。 Cleveland 数据库的实验集中在试图区分存在(值1、2、3、4)和不存在(值0)。
另⼀个UCI Heart Dia Datat.csv是对官⽹数据集稍做处理后的数据集
park1-12相同
13)thal-⼀种称为地中海贫⾎的⾎液疾病(0 =正常;1 =固定缺陷;2 =可逆缺陷)
14)target- 患者是否患有⼼脏病。存在(值1)和不存在(值0)。
处理内容:高考语文卷
官⽹原始数据集⼀共有303⾏, 14列,⾏索引从0-302韩版t恤
其中ca列有4个缺失值,⾏索引分别为166,192,287,302
其中thal列有2个缺失值,⾏索引分别为87,266
去除缺失值后,UCI Heart Dia Datat数据集[297 rows x 14 columns] thal指标⽤0,1,2进⾏替换
inspi
少儿英语加盟网target指标换为存在(值1)和不存在(值0),⽅便做⼆分类。
最终数据类型: