전쟁을 배우는 클라우드 머신 가열

기계 학습은 빅 데이터 혁신의 다음 국경입니다. 그리고 구름은 그 국경의 다음 국경입니다.

거의 5 년 전에 Google은 Prediction API 클라우드 기반 기계 학습 서비스를 출시했습니다. 지난 7 월, Microsoft는 Azure Machine Learning (Azure ML) 서비스를 미리보기로 시작하여 2 월에 일반용으로 출시했습니다. 이 서비스는 오픈 소스 R 프로그래밍 언어로 작성된 코드와 놀랍도록 잘 통합되었습니다.

이는 흥미로운 오프닝 움직임 이었지만 마이크로 소프트가 1 월에 오픈 소스 R 프로젝트에 기여하는 상업적 주체 인 Revolution Analytics와 R의 강력한 분산 컴퓨팅 버전 개발자 인 Revolution R을 인수하겠다고 발표했을 때 줄거리가 두꺼워졌다. Hadoop과 특히 잘 통합됩니다.

그러나 지난 주, 장갑은 정말로 벗어났습니다. MS는 지난 월요일, 레볼루션 애널리틱스 인수를 완료했다고 발표했다. 그리고 목요일 아마존은 클라우드 머신 학습 서비스 인 아마존 머신 러닝 (아마존 ML)의 발표를 마침내 발표했다. 이제 세 종 경주가 시작되었습니다.

Amazon Machine Learning은 S3, Redshift 및 RDS (Relational Database Service)의 MySQL 버전과 연결되며 Google Prediction API는 Google Cloud Storage 및 BigQuery에서 데이터를 읽을 수 있으며 Microsoft는 Table 및 Blob 스토리지 서비스를 데이터 소스, SQL 데이터베이스, Hadoop의 Hive 테이블 및 유효한 인터넷 URL이 가리키는 OData 피드와 플랫 파일을 모두 포함합니다.

완벽한 한쌍의 세, 어느 것을 사용해야합니까? 그들은 모두 훌륭한 제품이며, 예측 분석을 아직 구현하지 않은 경우 그 중 하나를 사용하면 매우 유리할 것이며, 그렇지 않은 경우가 있습니다.

세 클라우드 제공 업체는 모두 자사의 기계 학습 서비스가 내부적으로 사용했던 것과 동일한 기술을 기반으로한다고 주장합니다. Amazon은 물론 처음부터 전자 상거래 비즈니스에서 예측 분석을 사용했습니다. Google은 핵심 검색 서비스에서 예측 논리를 사용합니다. Microsoft는 Bing, Xbox 및 기타 서비스에서도 마찬가지입니다.

데이터 소스의 관점에서 볼 때 세 가지 주요 공개 클라우드 제공 업체는 핵심 스토리지 서비스와 하나 이상의 데이터베이스 제품을 기계 학습 오퍼링에 연결했습니다

전화 해주세요. 일단 데이터가 읽히면 세 가지 공급자 모두 예측 모델 구축을 지원합니다. 또한 개발자가 입력 변수 값을 보내고 대상 변수에 대한 예측 값을 받기위한 API를 제공합니다. 클라우드에이 모든 것을 집어 넣는 매력은 모든 클라이언트 애플리케이션이 단일 웹 서비스 호출을 작성하여 예측을 실행할 수 있다는 것입니다.

예를 들어 성별, 소득, 연령 및 직업과 같은 인구 통계 학적 데이터 포인트를 특정 항목을 구매할 가능성에 연관시키는 모델을 만들 수 있습니다. 퍼블릭 클라우드 제공자의 기계 학습 서비스를 사용하면 웹 서비스 호출을 수행하고 인구 통계 학적 데이터를 입력 매개 변수로 제공하고 예상 값 (예 : 구매 여부를 나타내는 예 또는 아니오)을 반환 값으로받을 수 있습니다 .

주변 쇼핑; 서비스는 비록 다르다. 예를 들어

그 이름에 사실 인 Google Prediction API는 개발자 지향적이며 사용자 인터페이스 (UI)를 제공하지 않습니다. Amazon ML은 모델을 구축 할 수있는 단 하나의 (다소 불투명 한) 알고리즘만을 제공합니다. Microsoft와 Google은 알고리즘을 선택하고 Microsoft는 R 및 Python 코드와 패키지를 사용할 수 있도록 허용하고 Microsoft는 본격적인 플로우 차트 스타일의 데이터 흐름을 UI에 제공합니다. Amazon은 입력 데이터 세트의 지정 및 데이터 세트의 스키마에서 입력 변수 및 대상 변수를 선택할 수 있습니다. Amazon ML은 알고리즘 및 UI 제한을 부과 할 수는 있지만 마법사 기반이며 사용하기가 쉽습니다. .

스타 트렉 : 긍정적 인 미래주의와 과감한 사회적 논평 50 년, 마이크로 소프트의 표면 올인원 PC가 10 월 하드웨어 출시를 표명한다고 발표했다. 아이폰 7, 새로운 애플 워치, 에어 포드와 손을 잡고 구글은 아 피기를 6 억 2500 만 달러에 사들였다.

설문 조사에 따르면 … 그렇다면 빅 3 중 어느 것이 승리 할 것입니까?

Amazon은 S3에 대한 연결성과 많은 회사에서 저장 한 데이터의 양을 감안할 때 현업 성향의 이점을 갖고 있습니다. 한편 Google은 핵심 비즈니스에서 가장 혁신적으로 기계 학습을 사용한다는 명성을 얻고 있습니다.

Microsoft의 서비스는 아마도 가장 정교하고 유연하며 잘 연결된 것일뿐입니다. Hadoop 및 데이터 통합 ​​서비스 인 Azure Data Factory (여기에서 자세히 설명 함)와 통합 할 수있는 유일한 서비스입니다. 그리고 마이크로 소프트가 Revolution Analytics의 기술을 Azure ML (당연한 것으로 받아 들여서는 안되는 것)과 맞물리게 할 수 있다면 정말 힘든 일이 될 수 있습니다.

결국 고객은 다른 데이터 처리 작업에 가장 자주 사용하는 클라우드 고유의 기계 학습 서비스를 사용하게 될 것입니다. 어떤 서비스가 그 잠김을 능동적으로 뛰어 넘기를 원한다면 광범위한 분석 서비스 내에서 기계 학습을 통합해야합니다.

Big Data Analytics, 빅 데이터 애널리틱스, DataRobot은 데이터 과학의 저조한 성과를 자동화하는 것을 목표로하고 있으며 Big Data Analytics, MapR 창업자 인 John Schroeder는 사임하고, 대체 할 COO

Microsoft의 경우 Azure ML을 Power BI에 연결한다는 의미입니다. Google은 Prediction API-BigQuery 통합을 상호 확장하여 BigQuery에 대한 쿼리가 SQL JOIN을 통해 Prediction API 모델을 참조 할 수 있도록 할 것입니다. Amazon은 EC2에서 실행할 수있는 타사 BI 제공 업체 (예 : Jaspersoft, Logi Analytics 및 Tableau)와 협력해야하는 번거 로움을 겪을 것입니다. 그러나 그 결과는 클 것입니다.

정리하는 데 시간이 걸릴 것입니다. 그러나 그런 일이 발생하면 마침내 기계 학습에 주류가 될 것이며 비즈니스 경쟁력은 크게 바뀔 수 있습니다.

그녀의 병참 지원 및 연구 기여에 대한 Jen Stirrup에게 특별히 감사드립니다.

LinkedIn, 새로운 블로깅 ​​플랫폼 발표

Big OLAP 시대인가?

DataRobot은 데이터 과학의 낮은 매달린 열매를 자동화하는 것을 목표로합니다.

MapR 창업자 존 슈뢰더 (John Schroeder)가 물러났다.