首 页中心介绍学术会议研究项目成果平台专家观点学术队伍 
学术会议
石勇
石勇
信用评级与数据挖掘:虚拟经济风险测度的应用
石勇
(中国科学院虚拟经济与数据科学研究中心常务副主任)
2008年9月26日,南开大学伯苓楼报告厅
(根据录音材料整理,未经本人审阅)

 
  我今天的演讲内容和前面几位不太一样,刚才肖老师说他是做统计的我是做数据管理的,我和刚才几位老师都有一个共识,就是华尔街金融风暴的出现,说明美国的金融家以利益为驱动,为了钱所以以利益驱动。“和尚打伞,无法无天”,由于金融自由化,他们没有监管办法,刚才唐老师也说了这一点,就是说次贷机制不完整。“无天”是说在整个过程中没有金融控制的基本理念,所以才产生这样的结果。
  刚才讲的华尔街金融风暴是因为产品的失控,我不知道有多少人知道什么是次贷?如果大家中有谁知道可以举手告诉我,如果你们不知道次贷是什么,哪怎么研究次贷。我的专业就是评分系统,我也有我的观点,大家别认为,美国要消失了要退出历史舞台了。我认为50年后美国依然是领头羊,我们在这分析的只是一个学生,而美国是一个50岁的老人了。这是我在 4月份的时候,看到的一篇国际政策的文章。我们现在讲到了美国的信用卡制度。现在的金融风暴是因为商人乱搞的结果。所以就引用了那句话“和尚打伞、无法无天”,你看这是美国的信贷管理。特别是信用管理,我们中国到现在还在学第一步。
  (PPT演示)这是信用卡的比较,这是美国和世界上其他国家的比较。现在是美国人人均有5张卡,巴西有5张,中国是33个人一张卡,印度是64.5个人一张卡。我们为什么不能发展快,因为我们没有个人的信用监管系统。这一点我们要和美国学。我再讲什么叫信用呢?信用就是简单的信贷,今天早上已经讲了,从马克思开始讲起,其实在马克思以前就有人在讲。这是以诚信为基础的。在我们这一代人非常清楚,过去中国的人标准就是“三转一响”包括自行车、缝纫机、收音机等,我们的老人在要买东西的时候,比如说要买自行车的时候,你一个月工资20元一辆自行车110元。怎么办?没有办法。现在信贷发展就是信用经济发展的一个最主要的动力。我记得1996年的时候,中国经济的发展应该是信用危机。在法律保障下面,把自己的钱合法的掏出来花,而且花的很有次序,那么这样的话,就没有问题。我们要搞自我经济的发展。现在在十年之后,变了一种方式,这种担保是一个问题。
  信用分类,第一条叫企业信用,第二条叫私人信用。信用评分在620分以下,就是信用很差的就成为了次贷。那么次贷的问题就出来了。我们讲了信用的问题,美国的信用经济发展的很好,它是发展经济的主要手段,而且提高了人民的生活水平,美国的信用卡发展的很好。从历史上来讲,从1810英国的布鲁林克成立征信局,我们国家到目前为止,还没有一个系统的制度。我们这个中心就是在为这个事做事。他们的征信工具和评分系统就是我们中心在做。如果要制作信用评分系统的话还为时过早。我下面讲一下信用评估系统,人民银行目前已经做了一个企业数据库和个人的数据库。你可以查到个人的情况。评分是告诉你,你在个人信用的空间中的实际情况。评分还会产生评分数,可以衡量你的贷款能力如何。企业评分的系统很多东西不可以数量化,可以是AA制到CC制,这个是企业评级在金融风暴中的重要问题。
  第二,在金融衍生品中间没有评分系统。这个就没有办法的,要控制风险。评分系统是从350分到850分之间,就像中国人说的“人之初、性本善”,当你进入系统的时候你得分数很高,当你有坏帐记录的时候,信用分数就在减少。你如果是好的分数高,你如果坏的话分数就低。如果作为个人来讲,要申请贷款肯定要到银行贷款,在中国现在是这样的,因为每个银行的贷款系统都不一样。其实真正的贷款系统应该是有一个第三方的评分系统。你不能贷款就都不要贷款,如果是次贷就都要次贷。
  评分分为五种考虑,第一,评分系统考虑各种信用信息;第二、每个因素的重要性取决于所有其他因素的相关性;第三,评分的信息直接来源于个人信用历史报表;第四,评分同时考虑正面和负面的信息;第五,评分不考虑人种、宗教、性别、婚姻状况和国籍。
  (PPT演示)下面我举一个评分系统的例子,这个数据670分就是在中间,这个人是在全国的分布属于30%的人,就是670分的人是有风险的。但是换一个角度来看,整个全部分布中间,这种借款人的能力是占16%的。7%以下的东西就是620分以下,从11%开始都叫次贷。但是倒过来来看,欠帐的程度就更低才15%,也就是说金融规则保证你要贷款的人最好在650分以上的人。次贷就很清楚了。所以说我觉得咱们的评分系统很重要。次贷也是非常重要的,如果我们有的同学来次贷都搞不清楚不是觉得很可笑吗?
  下面讲一下信用评分系统的意义,一方面和银行和金融行业可指定可靠的、准确的信用政策。但是华尔街仍然使用这个打包的产品。那么对于银行来讲,这是确定市场和开拓新顾客的方式,在中国每个银行平均发一个卡的话,成本消费是110美元左右,美国是120美元左右。但是如果是通过信用评分的话,可能对发卡行是下降的。对顾客来讲,你是自然的,你不用去考虑别人是否给你卡。只要一看评分就可以得到社会公正的待遇。所以说评分系统是很有效的。
  (PPT演示)这个系统怎么做呢?这个是搞数据分析的。数据分析有些人不知道,我们的国家翻译不太好,但是数据中心的话,叫“数据基数”,现在叫“数据挖掘”。所有的衍生产品都是和这个有关系的。 到目前为止,如果你看美国的市场化,前四名的都是和数据化有关系的。所以,搞计算机的人搞数据的人仍然可以在华尔街找到更何的工作。金融风暴一定是监管方面的问题。(PPT演示)大家可以看到,这是美国的个人信用破产情况。美国每年有150万左右的人根据法律破产。这个一方面你要他提前花钱,另一方面还要他破产。这个用数据的方式给他一个提醒。(PPT演示)这个数据分析的话是很清楚的。这是在历史上有很长时间的工作了,这是英国的剑桥大学访问的时候,找到的一个统计学家,他在1783年就开始用数据分析英国的国债发展情况如何。这是他的原稿,这个数据集和在用的任何的计算机的数据集是一样的。从这个角度来看,什么叫数据挖掘,是指分析电脑中存储的海量数据并发现知识。包括美国总统大选和医疗方面的应用,它们都是通过这样的方式来进行投票选举的。
  数据化一般来讲是在大型的领域、大规模数据集的时候来应用的。有独到的学习方法和独到的学习方法。主要是用自动化的方法来探索未来的知识。像银行应用的数据化用的比较多了,将近20%的客户决定了银行的利润。(PPT演示)数据挖掘与商业职能,这是我们做的一个结果。我想具体的思想和原理我在这里不讲了。这个是一个典型东西,这个是我们过去和中国建设银行一起合作的信用因素样本。上面的东西是表示坏帐,后面的蓝线表示的是好的。这上面有好和坏之间的交换情况。这个是美国信用卡的分析,上面是好的东西,下面是坏的情况,这两个参数的分析情况。(PPT演示)这种分析表格大家知道在信用分析方面是很赚钱的。这是是给休斯敦银行的合作。这张表格就是45000美元。这个表格将表示这6000人在六个月后的变化情况。这个东西如果用到金融衍生上来,根据不会产生这些问题。现在很多人都是靠写单纯的文件来挣钱。我有一个学生每个月挣100多万块钱,就是靠写文章来挣钱。(PPT演示)这个是一个大样本的测算,它赔偿的方式有几种,第一种是你的房子、工地、老婆、小孩统统没有了。第二种破产是有限破产、分期破产。第三种是呆帐。第四是优秀的成员。
  (PPT演示)中国的信用管理情况如何?这是中国的情况。我们从2006年6月中国人民银行征信中心拥有全国各大金融机构的所有个人信贷账户的信息,人数超过6亿。数据积累也超过了3年,已经具备了研制和开发信用局风险评分的条件。这个评分系统的结果就不用说了。(PPT演示)这是我们做的模型。具体来看,用我们的四个模型从中国人民银行随便抽了7个人的情况来看,例如第三个人信用表现还是不错的,基本上这个人就是一个好人。但是最后一个人看他的数据绝对是坏人。四个模型上的数据差不多。结果发现这个人贷款五六次根本没有还账所以这个人肯定是坏人。像这种人是典型的次贷。(PPT演示)更有兴趣的事在后面,中美评分的必要,大家知道,美国使用信用评分已经超过20年的历史。美国大部分人还不是次贷,大多数人还是好人,次贷是Poor下面的。如果你给这部分人贷款肯定会出问题的。
你看我们用四个中国模型做的东西这个是中国的平均值。这个数据是中国30个省市中间抽样调查的。记得去年和领导汇报的时候,我们的领导很高兴,中国和美国的房贷是差不多的。(PPT演示)这是美国的分布,看到最后那个东西,这个表格从600分以下的就是次贷。(PPT演示)中国的四个分布,也是如此的,这个叫Fico分布。就是说我们的很多东西在这些方面,在金融监管方面成功的经验已经不少了。
  下面我讲一下自己的观点,我觉得对美国不应该太担忧了。美国的次贷危机一定会度过去的。他们的金融体制比我们完整到100倍不止。我们应该采取毛泽东说的,“学习人家、去伪存真、洋为中用”,这很重要,我们应该学习他们的好的东西。比如说我们现在很多好的东西都没有建立起来。第二,美国的金融衍生产品的创造性是非常好的,比如说上海的金融期货都还没有。就是说我们如何在美国的基础上吸取教训、挖掘它的制度,把评分的系统数量化。不是数量化是绝对不行的,因为政策不能完全左右经济发展。但是没有数量去监管风险是不能靠制度解决问题的。实际上我的看法是一个心理上的救市,主要的目的是金融自由化,这是需要政策的调整。政策的管理一定要用数量化的办法去监管风险,这样经济才可以发展,从长远角度来讲,这个事不是坏事,我相信世界经济会继续发展,我希望中国经济可以发展的更快更好更健康。
  谢谢大家!


南开大学虚拟经济与管理研究中心
2008年9月28日
 
<< 返回