俄罗斯最大搜索引擎开源了一款权衡
现在,人工智能正在为越来越多的计算功能提供支持,今天,俄罗斯搜索巨头Yandex宣布,将向开源社区提交一款梯度提升机器学习库CatBoost。它能够在数据稀疏的情况下教机器学习。特别是在没有像视频、文本、图像这类感官型数据的时候,CatBoost也能根据事务型数据或历史数据进行操作。
今天,CatBoost以两种方式进行了亮相。
首先,Yandex宣布,将在自有服务中使用这款新的框架替换原来的机器学习算法MatrixNet。MatrixNet一直被应用在公司的很多业务上,比如排名、天气预报、出租车和推荐业务。现在,业务正在逐步从MatrixNet切换到CatBoost上来,并将延续几个月。
其次,Yandex将免费提供CatBoost库,任何希望在自己的程序中使用梯度提升技术的人员都可以在Apache许可证下使用这个库。 Yandex机器智能研究主管Misha Bilenko在接受采访时表示:CatBoost是Yandex多年研究的巅峰之作。我们自己一直在使用大量的开源机器学习工具,所以是时候向社会作出回馈了。 他提到,Google在2015年开源的Tensorflow以及Linux的建立与发展是本次开源CatBoost的原动力。
Bilenko补充说到,暂时还没有计划将CatBoost商业化,或以任何专利的形式将其闭源。 这和竞争对手无关,他说,我们很高兴有竞争对手使用它
长期以来,随着Yandex的不断发展,它一直在寻求提升俄语世界之外的国际地位。本次开源举动不仅仅是Yandex对开源社区的承诺,而且也展示了Yandex希望成为大型科技公司与开发者社区发展中心的决心。
就像Google持续地扩展和更新Tensorflow一样,今天的CatBoost版本是其第一个版本,以后将持续更新迭代。目前,这个库主要有三个特点:
减少过度拟合:这可以帮助你在训练计划中取得更好的成果。它基于一种构建模型的专有算法,这种算法与标准的梯度提升方案不同。
类别特征支持:这将改善你的训练结果,同时允许你使用非数字因素,而不必预先处理数据,或花费时间和精力将其转化为数字。
API??接口支持:可以通过命令行或者基于Python或R的API接口来使用CatBoost,包括公式分析和训练可视化工具。
虽然目前有大量的库可以利用梯度提升或其他解决方案来训练机器学习系统,但Bilenko认为,CatBoost相较其他大型公司使用的框架(如Yandex)的最大优点是测试精准度高。
有很多机器学习库的代码质量比较差,需要做大量的调优工作,他说,而CatBoost只需少量调试,就可以实现良好的性能。这是一个关键性的区别。
或者未经许可生产食品添加剂的 附CatBoost开源代码地址:
西安医院白癜风长春牛皮癣哪家医院好潮州看牛皮癣去哪个医院西安男科权威医院四川治肝病专科医院
南宁治疗白癜风医院
-
你曾经羡慕的人,在起初都貌似完美无缺
你以前喜欢的人,在先前都貌似完美无缺。即便当他逐渐四分五裂转化成一堆...
2023-11-02
-
用于哮喘脊髓损伤治疗的分子化合物
脑部伤害都会所致永久性老年人,从而受到限制现实生活活动,其主要原因是...
2023-10-12
-
英国央行助理经济学家:货币政策紧缩还没到头
英国国际货币基金组织助理经济学家Huw Pill回应,英国的汇率再加还有进一步...
2023-10-11
-
今后工业互联网产业规模迈过万亿大关
4月底19日,中华人民共和国财政部开幕新闻发布会,工业生产和智能化部简述...
2023-10-08
-
一鲸鱼搁浅慈溪象山海域!初步判断是抹香鲸,救援正在进行
19日凌晨8时许,三门县石浦镇铜瓦门大桥除此以外,右边山海域不远处,渔船...
2023-10-06
-
通威股份(600438.SH)2022-2024年员工持股计划已完成投资者购买 斥资约54.88
通威持股(600438.SH)发布日前,截至本日前披露日,新公司2022-2024年员工持股计...
2023-10-04