Big data là khái niệm không còn xa lạ với chúng ta và chúng được ứng dụng trong mọi lĩnh vực kinh doanh. Airbnb là thương hiệu nổi tiếng về dịch vụ thuê/cho thuê homestay, một mô hình kinh doanh dịch vụ kiểu mới trong lĩnh vực khách sạn.
Câu hỏi đặt ra, họ đã làm như nào để kết nối, tận dụng nguồn cơ sở vật chất từ các hộ dân ? Khách du lịch tìm phòng thuê ưng ý dựa theo nhu cầu của họ bằng cách nào, Airbnb hoạt động khắp các nước trên thế giới, vậy mô hình kinh doanh của họ ra sao?
Tất cả đều được ứng dụng bằng big data. Dữ liệu lớn giúp giải quyết vấn đề gì? 1,5 triệu list trên 34.000 thành phố và 50 triệu khách, thách thức lớn nhất của Airbnb, là kết nối lượng lớn những người có chỗ ở để cung cấp cho khách đòi hỏi hiểu biết về chủ nhà và du khách để sắp xếp ưu tiên các thuộc tính có sẵn trong khu vực vào đúng thời điểm, và giá cả hợp lý.
Dữ liệu lớn được sử dụng như thế nào trong thực tế ? Riley Newman chia sẻ:
- Một dữ liệu là một bản ghi của một hành động hoặc sự kiện, trong hầu hết các trường hợp phản ánh quyết định của một người
- Xâu chuỗi lại các sự kiện dẫn đến quyết định đó, bạn có thể học hỏi từ nó
- Đó là một cách gián tiếp người ta dạy bạn những gì họ thích và không thích - chỗ này thích hợp hơn chỗ đó, tôi thích tiện nghi này hơn tiện nghi kia, ... không nhiều lắm
Loại phản hồi này là mỏ vàng cho các quyết định về tăng trưởng cộng đồng, phát triển sản phẩm và ưu tiên nguồn lực…
Airbnb biết rằng họ nên nỗ lực tập trung vào đâu. Ví dụ: dữ liệu được sử dụng để xác định giá phù hợp của phòng dựa trên một số biến như vị trí, thời gian trong năm, loại chỗ ở, liên kết giao thông, v.v. .Điều này đặc biệt khó khăn khi không phải là phòng khách sạn, không có tiêu chuẩn để có thể đánh giá trên hệ thống xếp hạng.
Airbnb đã phát triển “Aerosolve” - Nền tảng phân tích hình ảnh , tự động chia các thành phố thành các khu phố nhỏ. kết hợp các mẹo định giá động bắt chước mô hình định giá của khách sạn và hãng hàng không. Aerosolve, phản ánh những hiểu biết của Airbnb về khách hàng của họ và điều này ảnh hưởng đến giá . Tất cả dữ liệu này được kết hợp thành một bảng điều khiển giúp chủ nhà xác định giá tốt nhất cho chỗ ở của họ.
Airbnb cũng vừa tiết lộ về Airpal: một nền tảng phân tích dữ liệu thân thiện được thiết kế để cho phép tất cả nhân viên của họ, truy cập vào tất cả thông tin của công ty và các công cụ để truy vấn.
Ngoài ra, các thuật toán học độc quyền được áp dụng trên toàn mạng để dự đoán các giao dịch gian lận trước khi chúng được xử lý và một hệ thống khuyến nghị mạnh mẽ cho phép khách và chủ nhà đánh giá lẫn nhau để tạo niềm tin.
Kết quả là gì?
Như Newman nói: Việc đo lường tác động của một nhóm khoa học dữ liệu rất khó khăn, nhưng một tín hiệu tốt là giờ đây họ hoàn toàn có thể tham khảo dữ liệu để ra quyết định cho cả người kỹ thuật hoặc phi kỹ thuật.
Ra mắt 2014, Airpal đã được hơn một phần ba nhân viên của Airbnb sử dụng để đưa ra các truy vấn. Thống kê ấn tượng này cho thấy dữ liệu trung tâm đã giúp Airbnb đưa ra các quyết định như thế nào. Sự phát triển của Airbnb là một dấu hiệu khác cho thấy việc sử dụng dữ liệu thông minh của họ đang được đền đáp.
Dữ liệu nào đã được sử dụng? Hình ảnh, vị trí, lưu trú (số phòng / giường, Wi-Fi, bồn nước nóng, v.v.), phản hồi và xếp hạng của khách, giao dịch, v.v ... Một số dữ liệu bên ngoài cũng được phân tích, ví dụ, chỗ ở tại vùng Edin-burgh trong thời gian lễ hội sẽ có giá cao hơn so với thời điểm ở một tháng khác.
Các chi tiết kỹ thuật là gì?
Airbnb giữ khoảng 1,5 petabyte dữ liệu của họ dưới dạng các bảng được quản lý (Hive-managed table) trong cụm Hệ thống tệp phân tán Hadoop (HDFS), được lưu trữ trên dịch vụ Web đám mây Amazon’s Elastic Compute Cloud (EC2). Để truy vấn dữ liệu, Airbnb đã từng sử dụng Amazon Redshift nhưng họ đã chuyển sang cơ sở dữ liệu Facebook Presto. Vì Presto là nguồn mở, điều này đã cho phép Airbnb gỡ lỗi sớm và chia sẻ các bản vá của họ ngược dòng - điều mà họ không thể làm được với Redshift.
Trong tương lai, Airbnb hy vọng sẽ chuyển sang xử lý thời gian thực trái ngược với xử lý hàng loạt (batch processing), điều này sẽ cải thiện việc phát hiện sự bất thường trong thanh toán và sự giả mạo tinh vi xung quanh việc tương xứng chính xác và cá nhân hóa.
Những thử thách nào phải vượt qua ?
Một thách thức lớn đối với nhóm khoa học dữ liệu Airbnb là theo kịp sự phát triển mạnh mẽ của công ty. Đầu năm 2011, nhóm chỉ gồm ba nhà khoa học dữ liệu. Đến cuối năm, Airbnb đã có 10 văn phòng quốc tế và các nhóm mở rộng mạnh mẽ, có nghĩa là nhóm dữ liệu không còn có thể hy vọng hợp tác với tất cả mọi người trong công ty.
Tìm cách dân chủ hóa công việc của mình, mở rộng từ các tương tác cá nhân sang trao quyền cho các nhóm, công ty và thậm chí cho cả cộng đồng của chúng tôi. Điều này đã đạt được bằng cách đầu tư vào các công nghệ nhanh hơn và đáng tin cậy hơn để đối phó với khối lượng dữ liệu mở rộng. Họ cũng chuyển các truy vấn dữ liệu cơ bản từ các nhà khoa học dữ liệu sang các nhóm trong toàn công ty, với sự trợ giúp của bảng điều khiển và công cụ truy vấn Airpal; điều này đã trao quyền cho các nhóm Airbnb và giải phóng các nhà khoa học dữ liệu khỏi các yêu cầu đặc biệt để họ có thể tập trung vào công việc có sức ảnh hưởng lớn hơn. Giáo dục các đội về cách sử dụng các công cụ này là chìa khóa để giúp họ hiểu rõ hơn về dữ liệu.
Các điểm học tập chính và mang đi là gì?
Airbnb là một ví dụ hoàn hảo về một công ty đang phát triển nhanh chóng với nhu cầu Big Data ngày càng mở rộng. Khả năng thay đổi và thích nghi khi công ty đã phát triển, có lẽ là trung tâm của sự thành công của họ. Điều này nêu bật bản chất không tĩnh của Dữ liệu lớn và cách chiến lược dữ liệu có thể cần thay đổi theo thời gian để đối phó với các nhu cầu mới.
Thật tuyệt vời khi thấy một nhóm khoa học dữ liệu được tích hợp tốt với tất cả các bộ phận của tổ chức (ngay cả khi họ không còn có thể gặp gỡ với mọi nhân viên!). Điều này không chỉ đảm bảo các nhà khoa học dữ liệu có sự hiểu biết tuyệt vời về các mục tiêu kinh doanh mà còn nhấn mạnh tầm quan trọng của việc ra quyết định dựa trên dữ liệu cho nhân viên ngay trên toàn công ty. Rốt cuộc, nó không quan trọng bạn có bao nhiêu dữ liệu nếu không có ai hành động.
Chia sẻ FB Lê Tuấn Anh