Vấn đề là Bộ y tế, cơ quan Bảo hiểm xã hội nên sử dụng quyền hạn của mình như thế nào để yêu cầu các bệnh viện cùng tham gia vào chiến lược xây dựng hệ thống Big Data một cách đồng bộ.
Vấn đề là Bộ y tế, cơ quan Bảo hiểm xã hội nên sử dụng quyền hạn của mình như thế nào để yêu cầu các bệnh viện cùng tham gia vào chiến lược xây dựng hệ thống Big Data một cách đồng bộ.
Big Data được ứng dụng trong rất nhiều lĩnh vực khác nhau như đã giới thiệu ở bài viết “Big Data – Tên gọi gợi lên khái niệm”. Bài viết tiếp theo dưới đây sẽ nói chi tiết hơn về các ứng dụng của Big data trong từng trường hợp cụ thể, và trong từng lĩnh vực đặc thù. Qua đó chúng ta sẽ thấy được tầm quan trọng trong việc thu thập và phân tích dữ liệu Big data.
với khát vọng là công ty đi đầu trong lĩnh vực khai phá dữ liệu Big Data, và tư vấn chiến lược trong tương lai, sẵn sàng hỗ trợ, đồng hành cùng bạn – dù bạn là ai – trên con đường khai phá Big Data. Nhưng trước hết công ty giới thiệu các bước khai thác Big Data. Theo SAS, các bước khai phá Big Data bao gồm:
Nếu các bạn đã theo dõi các bài viết của Big Data Uni thì chắc cũng đã nắm được tổng quan về Big Data bao gồm khái niệm, lợi ích và ứng dụng của nó trong nhiều lĩnh vực khác nhau. Trong chủ đề bài viết lần này và sắp tới, chúng tôi sẽ không đề cập về những giá trị mà Big Data đem lại mà đi vào trọng tâm một trong những công cụ, quá trình quan trọng nhất đối với mỗi dự án Big Data đó chính là Data mining (hay còn gọi là khai phá dữ liệu).
Một dự án lớn đang được tiến hành ở cả Anh và Mỹ nhằm thu thập thông tin thông qua một khối lượng lớn dữ liệu bệnh nhân. Đây là một dự án đầy hứa hẹn nhằm tối ưu hóa giá trị sử dụng thuốc, từ việc xác định sự kém tuân thủ trong điều trị để nâng cao chất lượng kê đơn.
Từ khi có ứng dụng data science, ngành y tế và chăm sóc sức khỏe cũng có những bước nhảy vọt quan trọng. 5 nhóm lĩnh vực data science đã áp dụng thành công những ứng dụng của data science có thể kể đến như Phân tích hình ảnh y khoa, gien và bộ gien, Điều chế thuốc, phân tích và chẩn đoán, ứng dụng phần mềm sức khỏe hay trợ lý sức khỏe tâm lý.
Giá trị khách hàng suốt vòng đời – Customer lifetime value
Một trong những khái niệm mà bất kể chuyên gia tiếp thị marketing hay chủ doanh nghiệp cần để ý là giá trị của khách hàng trong suốt vòng đời của họ. Điều này đặc biệt quan trọng khi đề ra chiến lượt tiếp thị marketing, định vị thương hiệu của mỗi nhãn hàng ( brand).Cụ thể hơn là khi đưa ra quyết định, tính toán về chi phí quảng cáo marketing cho mỗi khách hàng và ngân sách cho các chiến dịch tiếp thị marketing.
Ở các phần trước trong chủ đề về Statistics (thống kê) đã giới thiệu đến các bạn các khái niệm, lợi ích, ứng dụng của thống kê, đặc biệt Descriptive statistics (thống kê mô tả), một trong 2 dạng cơ bản của Statistics. Trở lại với bài viết lần này chúng tôi sẽ trình bày tóm tắt về dạng còn lại, chính là một số kiến thức của Inferential Statistics hay còn gọi là thống kê suy luận.
Bối cảnh, nguyên nhân tại sao các công ty ngày nay cần định hướng dữ liệu (Data – driven)
Nếu các bạn có theo dõi những các bài viết trước đây của thì chúng tôi đã đề cập nhiều về tầm quan trọng của dữ liệu – được coi là nguồn sống của mọi tổ chức trong thời đại 4.0 – cũng như các xu hướng của Big Data, Data Analytics, và nhu cầu khai thác dữ liệu để đạt được giá trị, lợi ích trong kinh doanh ngày càng được quan tâm hơn.
Nếu các bạn hoạt động, làm việc trong lĩnh vực thương mại điện tử (E-commerce) hay digital marketing chắc biết đến Data management platform (DMP) còn được gọi là nền tảng quản lý dữ liệu tập trung.
Tầm quan trọng của Big Data (Dữ liệu lớn) và sự nhận thức về giá trị của nó giảm dần, nhiều công ty đầu tư vào lĩnh vực này nhưng không đem lại kỳ vọng, và kết quả tốt lợi. Nguyên nhân do nhu cầu và tính chất phức tạp của hệ thống công nghệ kỹ thuật phải xây dựng, bảo trì, chi phí lại cao, thiếu nguồn nhân lực có chuyên môn sâu, và kỹ năng về lĩnh vực Data Science hay Data Analytics,…
Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.
Để thu thập các thông tin bệnh nhân các nhà nghiên cứu phải sử dụng đến đơn vị petabyte. Mỗi petabyte dữ liệu tương đương với 1 triệu gigabyte. Công ty Express Scripts, có trụ sở tại St Louis, Missouri, Mỹ, đã thu thập được 22 petabyte dữ liệu y tế từ 83 triệu bệnh nhân, với số lượng dữ liệu này được chuyển đổi thành định dạng MP3, sẽ mất khoảng 44.000 năm để lắng nghe hết số lượng tệp nhạc này.
Big data hay còn gọi là dữ liệu lớn, làm liên tưởng đến hình ảnh của hệ thống máy chủ khổng lồ. Nhưng Big data rộng và lớn hơn thế nhiều. Có 10 lĩnh vực chính trong đó dữ liệu hiện đang được sử dụng để tạo lợi thế tuyệt vời. Trong đó, dữ liệu có thể được đưa vào hầu hết mọi mục đích.
1. Xu hướng nghề nghiệp trong tương lai
Hiện tại, chúng ta đang sống trong giai đoạn đầu của thời kỳ cách mạng công nghiệp lần thứ 4. Triết lý của cuộc cách mạng công nghiệp 4.0 là chúng ta phải sử dụng công nghệ thông tin để tăng được năng suất lao động, từ đó tiết kiệm được chi phí, mang lại lợi ích cho người tiêu dùng.
Theo một báo cáo mới được công bố tại Diễn đàn Kinh tế Thế giới, những thay đổi về nhân khẩu học và tiến bộ kỹ thuật có thể dẫn đến việc 5 triệu việc làm sẽ biến mất vào năm 2020. Tuy nhiên, ngược lại có một số công việc lại được dự đoán sẽ có sự tăng trưởng đáng kể, trong đó có nghề phân tích dữ liệu.
Sự xuất hiện ngày càng nhiều các sản phẩm công nghệ, kỹ thuật số thông minh tiên tiến gia tăng tối đa trải nghiệm khách hàng cho thấy mức độ phổ biến và ứng dụng rộng rãi của Machine Learning để phát triển các sản phẩm AI (Artificial Intelligence – trí tuệ nhân tạo). Cũng chính các thay đổi cực kỳ lớn và thịnh hành của môi trường công nghệ đã tạo cơ hội, mở ra cánh cửa để Big Data thúc đẩy kinh tế, hỗ trợ các công ty cải thiện hiệu quả kinh doanh của mình thông qua khai thác giá trị tiềm ẩn, thông tin hữu ích từ dữ liệu.
Ngày nay, tiềm năng phát triển các chiến lược kinh doanh dựa trên dữ liệu và thông tin là lớn hơn bao giờ hết. Đối với một số tổ chức, dữ liệu và phân tích dữ liệu đã trở thành động lực chính trong việc đề xuất các chiến lược kinh doanh của họ.
Dữ liệu khách hàng hay Customer data được coi là tài sản, nguồn thông tin vô giá đối với mọi công ty thuộc nhiều lĩnh vực kinh doanh khác nhau. Việc triển khai các quy trình khai thác, dự án nghiên cứu, phân tích Customer data với mục đích tìm hiểu, nắm bắt mong muốn, nhu cầu thầm kín của khách hàng, và chuyển nó thành những giá trị cụ thể thông qua từng chiến lược, kế hoạch hoạt động chính là chìa khóa cạnh tranh của mỗi tổ chức ngày nay.
Trở lại với chủ đề về thống kê, ở phần trước chúng tôi đã giới thiệu đến các bạn các khái niệm về thống kê cũng như lợi ích và ứng dụng của nó, tiếp theo ở phần này, chúng tôi sẽ đề cập đến một mảng kiến thức quan trọng khác đó chính Descriptive statistics (thống kê mô tả)
Ngành công nghiệp du lịch và lữ hành đang đối mặt với thách thức bán đúng sản phẩm đến đúng đối tượng khách hàng vào thời điểm chính xác và giữ đúng giá ở đúng kênh. Tất cả điều này đòi hỏi dữ liệu nội bộ lẫn bên ngoài. Dữ liệu nội bộ như kỳ vọng của khách hàng trong quá khứ, tỷ lệ hết vé, doanh thu phòng và tình trạng đặt vé hiện tại. Dữ liệu bên ngoài gồm sự kiện, thời tiết, những chuyến bay và những kỳ nghỉ.
Có nhiều phương pháp khác nhau để thu thập dữ liệu. Người ta có thể chia thành hai loại.
Đó là phương pháp bàn giấy và phương pháp hiện trường.
TTCT - College Board, tổ chức phi lợi nhuận đang phụ trách kỳ thi SAT, đã bán mỗi cái tên thí sinh kèm theo các thông tin liên quan với giá 47 cent (khoảng 11.000 đồng), gây ra những tranh cãi dữ dội về tuyển sinh đại học ở Mỹ.
![]() |
Ảnh: Chronicle.com |
Dữ liệu về xe hơi sản xuất trong các năm gần đây, bao gồm năm sản xuất (year), hãng sản xuất (make), model, trim. Kèm theo tool đọc dữ liệu bằng PHP
KHI MỘT CHUYÊN GIA PHÂN TÍCH DỮ LIỆU NHẬN ĐƯỢC YÊU CẦU TỪ CÁC PHÒNG BAN, BỘ PHẬN HAY LÃNH ĐẠO CÔNG TY, CHUYÊN GIA ẤY CÓ THỂ NHẢY VÀO PHÂN TÍCH NGHIÊN CỨU NGAY VẤN ĐỀ. NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU SẼ MONG MUỐN TỪ YÊU CẦU ĐƠN GIẢN BAN ĐẦU SẼ TÌM RA PHÁT HIỆN TUYỆT VỜI, ĐƯA RA ĐƯỢC CÁC ĐỀ XUẤT HAY NHẤT ĐỂ ÁP DỤNG CHO CÔNG TY. NHƯNG THỰC TẾ THƯỜNG KHÔNG THUẬN LỢI NHƯ VẬY.
Đa số các bạn nhảy vào phân tích dữ liệu ngay, trước khi bạn lên kế hoạch và mục tiêu của dự án phân tích dữ liệu. Và cũng tương tự như vậy, bạn có thể nhảy vào làm slide cho một buổi thuyết trình trong môi trường kinh doanh trước khi bạn lên kế hoạch cho thuyết trình đó. Và tất nhiên bạn sẽ kết quả là tốn rất nhiều thời gian cho slide mà không đạt được kết quả tốt nhất.
BạnCầnGìCứHỏiDVMS: Chuyển đổi số giao thông, vận tải, giao nhận thông minh ; Giải pháp Blockchain ; Tư vấn, xây dựng, chuyển giao mạng xã hội ; Dịch vụ dữ liệu, Big data ; Uber Giúp việc, uber dịch vụ tại nhà ; Chuyển đổi số cho bệnh viện, y tế ; Chuyển đổi số Bác sĩ gia đình, y tế tại nhà ; Chuyển đổi số cho công ty tín dụng, ngân hàng, Fintech ; Chuyển đổi số cho công ty bảo hiểm ; Chuyển đổi số bán hàng, quản lý hệ thống phân phối ; Chuyển đổi số lĩnh vực du lịch; Chuyển đổi số lĩnh xăng dầu, gas; Giải pháp OTT; Chuyển đổi số nhà thuốc và công ty dược; Chuyển đổi số doanh nghiệp taxi; Chuyển đổi số doanh nghiệp vận tải; Chuyển đổi số dịch vụ tại nhà; Chuyển đổi số nông nghiệp; Giải pháp QRCODE ; Đào tạo chuyển đổi số, xây dựng đội ngũ CNTT cho doanh nghiệp và start-up; Giải pháp chăm sóc sức khỏe tại nhà ; ứng dụng định vị vệ tinh vào cuộc sống;Giải pháp truyền hình; thực tế ảo; mobile game; và giải pháp cho nhiều lĩnh vực khác