• 机器学习
    云+机器学习=? 周六,亚马逊宣布AWS将新增机器学习服务,这项服务“面向没有经验的开发者,可以完全托管”。提交至该服务的所有数据都将保密,而随着客户向其中输入更多数据,这一系统将越来越智能。   过去的多年里,机器学习技术一直在亚马逊公司内部使用,主要被用于亚马逊商城的个性化推荐。但AWS的一些大客户,包括社会活动网站Change.org,要求亚马逊提供更多的机器学习支持。   对于大多数企业,包括中小型互联网企业和几乎所有的传统企业,它们不具备自己搭建云平台的能力和优势。云就像电网集中供电一样,通过网络从hub向分支传输资源和能力。每个企业自己进行数据存储、计算、分析,就像自己用发电机发电一样,不会是主流现象。   在亚马逊之前,其他巨头也在尝试将云和机器学习结合起来,微软推出Azure云机器学习平台,谷歌则允许Prediction API接入谷歌云。   《纽约时报》评论道,微软、谷歌、亚马逊谁会成为最大的赢家,这不是最重要的,最重要的是,亚马逊拉低了云机器学习的价格和门槛。我们离一个低成本预测的时代更近了,而这里说的预测,不局限于预测购物行为、观影喜好等等,而是全面渗入整个世界:基因组学,物联网,大型网络软件,企业决策……   当然,就像电厂故障会带来巨大的经济损失一样,随着云平台承载了越来越多的任务,安全性和可靠性被摆在了更重要的位置。哪家公司都不想像Netflix一样,因为AWS数据中心故障,用户无法正常观看视频。   云服务是否能赢得足够的信任和认可,除了本身的政府的行动对此有很大影响。去年,6亿美金的CIA大单最终花落AWS。老顽固CIA的认可,是对AWS可靠度和影响力的有力背书。而在我国,去年工信部出台可信云认证,试图指出一条透明的云服务之路。   来源:36氪  作者:胡卷卷   扫一扫,关注“HRTechChina",聆听人力资源科技的声音!
    机器学习
    2015年04月13日
  • 机器学习
    大数据+机器学习+平台,Dato拿了1850万美元B轮融资 大数据在硅谷炙手可热,拿融资自然也不再话下,拿到千万级美元融资的也有不少,不久前大数据分析云服务GoodData就获得了Intel Capital领投的2750万美元。据华尔街日报消息,机器学习平台 GraphLab 刚刚改名Dato,并获得了 1850 万美元新融资,投资方为 Vulcan Capital 、Opus Capital 、New Enterprise Associates、Madrona Venture Group。此前他们曾获得680万美元融资。   GraphLab 提供了一个完整的平台,让客户能够使用可扩展的机器学习系统进行大数据分析。简单来说,就是从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。这么讲挺抽象,我们还是具体举几个例子吧。可能最好理解的就是民主国家政府的民意调查,可以通过社交网络、媒体等提取数据,分析出民众到底在关心什么,分析出哪些区域的哪些问题必须关注、解决。其实,生物医学研究团队也会使用 GraphLab,主要是来分析临床记录,从而预测病人的病情发展趋势。零售业可以做价格预测、用户推荐;金融服务业可以做诈骗预警;市场公司则可以通过情绪分析锁定关键客户。现在 GraphLab 的客户已经包括 Zillow、Adobe、Zynga、Pandora 等。   那为什么是 GraphLab(现在应该叫 Dato 了)会获得这么多客户的青睐呢? 其实,将原始数据转化为决策依据,并作出预测,这个过程还是很复杂的。往往需要大量的数据处理工具,收集、清洗数据,再建模分析,得出结论,进行展示;还需要大量的数据科学家或同样知识渊博的软件工程师来配合完成。既耗时费力,还投入不菲。所以 GraphLab 这样的平台,可以让毫无编程经验的数据科学家,快速地将理念转化为生产环境可以使用的产品,提高企业的生产效率,自然受欢迎。值得一提的是,Dato 现在能处理各种数据类型。     GraphLab 的创始人 Carlos Guestrin 是机器学习界国际公认的大牛,曾被 Popular Science 杂志评为 2008 年 “Brilliant 10”,还获得过美国青年科学家总统奖。2008 年在卡耐基梅隆大学带着两个学生研发了 GraphLab 的原型,2012 年被 Jeff Bezos 游说去了华盛顿大学。   在 Madrona Ventures 和 NEA 的资金支持下,2014 年 3 月创办了 GraphLab,并以测试版的形式推出了第一个商业版。2013 年 10 月,增加了机器学习功能,推出了新版本。现在的 GraphLab 已经不仅仅是图谱分析了,更是一家基于 AI 的大数据公司,能够处理各种数据类型,所以公司也改名叫 Dato 了。   在美国现在的大数据公司主要有四类:   数据的拥有者、数据源:特点是业务优势能收集到大量数据,就像煤老板垄断一个地区的矿一样。其实大多数有能力产生或收集数据的公司都属于这类型,比如Vantage Sports和收集了PB级数据的包子铺。   大数据咨询:特点是非常技术,提供从基础设施规划建设维护到软件开发和数据分析等的服务,但不拥有数据,比如Cloudera这家不到500人的startup是最著名的Hadoop架构咨询公司。   做大数据工具的:比如AMPLab出来的Databricks和Yahoo人主导的Hortonworks。   整合应用型:特点是收集拥有或购买一些数据,然后结合AI来解决更多实际的痛点。   像 Dato 这种做整合应用型的大数据公司才有可能有希望。未来是 AI 的,而 AI 的食物是数据。就像很多产业链一样,最困难且最有价值的创新往往发生在接近最终用户的那端,比如 iPhone。大数据行业最有价值的部分在于如何利用机器去处理数据得到洞见,影响组织和个人的行为,从而改变世界。收集和整理数据在未来会变得标准化和自动化,而利用 AI 进行分析的能力会变得更为关键。   [36氪,作者: 小石头]
    机器学习
    2015年01月09日