SỰ THÍCH HỢP CỦA CÁC KHUYẾN CÁO VỀ DỰ PHÒNG BỆNH TIM MẠCH THU ĐƯỢC TỪ MÔ HÌNH TRÍ TUỆ NHÂN TẠO DỰA TRÊN TRÒ CHUYỆN TRỰC TUYẾN

SỰ THÍCH HỢP CỦA CÁC KHUYẾN CÁO VỀ DỰ PHÒNG BỆNH TIM MẠCH THU ĐƯỢC TỪ MÔ HÌNH TRÍ TUỆ NHÂN TẠO DỰA TRÊN TRÒ CHUYỆN TRỰC TUYẾN

Trí tuệ nhân tạo Chat GPT: Kỷ nguyên mới nhưng hàng tỷ người có thể gặp  nguy hiểm

(Hình ảnh trên internet)

Biên dịch: Vũ Trang, Phạm Uyên, Thu Thảo

Hiệu đính: Phạm Duy Tú Anh

Bảng từ viết tắt

LDL-C Low-density lipoprotein cholesterol Lipoprotein tỷ trọng thấp
CVD Cardiovascular disease  Bệnh tim mạch
AI Artificial intelligence Trí tuệ nhân tạo

Để thu được những lời khuyên về ngăn chặn bệnh tim mạch (CVD), những cá nhân có thể thăm dò những nguồn thông tin bao gồm những thông tin trên internet, hoặc liên lạc với các chuyên gia. Phiên bản nghiên cứu của mô hình ngôn ngữ trí tuệ nhân tạo dựa trên đối thoại được ra mắt vào tháng 11 năm 2022 và thu hút được sự chú ý rộng lớn, những báo cáo truyền thông đưa ra rằng có nhiều hơn một triệu người dùng trong ngày. Sử dụng giao diện trò chuyện, mô hình AI này trả lời những câu hỏi tương tác phức tạp, những câu hỏi cơ bản về dự phòng bệnh tim mạch.

Giới thiệu về ChatGPT

ChatGPT (Chat Generative Pre-training Transformer) là một mô hình ngôn ngữ trí tuệ nhân tạo được công ty OpenAI cho ra mắt vào tháng 11 năm 2022. Công cụ này tương tác theo cách đối thoại, có khả năng đưa ra câu trả lời có tính chính xác cao dưới dạng văn bản, tự ghi nhận sai sót và từ chối các yêu cầu không phù hợp [1]. 

 

Cách hoạt động của ChatGPT

Mô hình này được đào tạo với sự kết hợp của các thuật toán học tăng cường và đầu vào của con người với hơn 150 tỷ tham số. Sau khi đào tạo với một kho văn bản lớn, mô hình được đào tạo để dự đoán câu trả lời cho một câu hỏi nhất định thông qua quá trình học có giám sát. ChatGPT học thông qua quá trình thử và sai bằng các thuật toán học tăng cường, thưởng cho các hành vi mong muốn và trừng phạt những hành vi không mong muốn. Quá trình này cho phép ChatGPT điều chỉnh hành vi của nó dựa trên thông tin đầu vào từ người đánh giá là con người. Do đó, ChatGPT nhanh chóng hiểu, diễn giản và tạo ra văn bản có độ mô phỏng con người cao và duy trì sự mạch lạc trong cuộc trò chuyện, từ đó hoàn thành các yêu cầu ở nhiều lĩnh vực, giúp nâng cao hiệu quả các tác vụ liên quan đến việc xử lý ngôn ngữ của con người [2, 3].

 

Tiềm năng của ChatGPT

Hiện tại, công cụ này vẫn còn một số hạn chế về tính cập nhật của câu trả lời đối với các vấn đề xảy ra sau giai đoạn đào tạo chính, các câu trả lời đôi khi vô nghĩa, có xu hướng dài dòng và không có khả năng đặt câu hỏi để làm rõ yêu cầu khi người dùng nhập một câu hỏi mơ hồ. Tuy nhiên, OpenAI giám sát phản hồi và phản hồi bằng bộ lọc nội dung bên ngoài để cải thiện mô hình AI. Điều này giúp mô hình nhận diện và loại bỏ các kết quả giả và đầu ra có khả năng gây hại [1]. Trong lĩnh vực chăm sóc sức khỏe, việc sử dụng công nghệ AI như ChatGPT có tiềm năng cách mạng hóa lĩnh vực nghiên cứu y khoa bằng cách tự động hóa một số tác vụ nhất định như trích xuất thông tin từ hồ sơ y tế điện tử, hỗ trợ tìm kiếm tài liệu, tạo bản nháp cho các quy trình thử nghiệm lâm sàng hay cung cấp hướng dẫn về cách viết và định dạng [2-4].

 

Phương pháp

Nghiên cứu này được thực thiện vào tháng 12 năm 2022. Nghiên cứu đã tạo 25 câu hỏi chú tâm đến khái niệm dự phòng cơ bản, bao gồm lời khuyên về yếu tố nguy cơ, dựa vào các chủ đề dự phòng dựa trên guideline và kinh nghiệm lâm sàng của người thiết kế nghiên cứu tại phòng khám chăm sóc dự phòng tim mạch hạng ba (Bảng). Mỗi câu hỏi được đặt ra cho giao diện AI trực tuyến 3 lần và các phản hồi được ghi lại. Mỗi bộ của 3 phản hồi được phân loại bởi kinh nghiệm dự phòng tim mạch của bác sĩ lâm sàng. Sẽ có 1 người đánh giá được chỉ định cho mỗi bộ phản hồi. Tổng cộng có 3 người đánh giá đã tham gia vào nghiên cứu này. Những người đánh giá xếp loại mỗi bộ phản hồi bằng một trong hai câu “thích hợp” hoặc “không thích hợp” dựa trên phán đoán lâm sàng của họ, và nội dung của phản hồi sẽ là “không thực tế” nếu 3 câu phản hồi mâu thuẫn với nhau. Bộ phản hồi được xếp hạng là không thích hợp nếu như bất kỳ câu nào trong ba phản hồi liên quan đến thông tin không thích hợp. Những người đánh giá xếp loại các phản hồi tại 2 hoàn cảnh có tính chất giả thuyết: những phản hồi trên nền tảng thông tin hướng tới bệnh nhân (giống như những website thông tin dựa trên bệnh viện) và như là những phản hồi dự án do AI tạo ra tới các câu hỏi bằng tin nhắn điện tử được gửi bởi bệnh nhân cho đánh giá của bác sĩ lâm sàng.

 

Kết quả

Phản hồi của mô hình AI có 21 trong 25 câu hỏi (84%) đã được xếp loại thích hợp trong mỗi hoàn cảnh (Bảng). Bốn phản hồi (16%) có thông tin không thích hợp; về 1 bộ, 1 trong 3 phản hồi là không thích hợp. Ví dụ, mô hình AI đã trả lời câu hỏi về sự tập luyện bởi khuyến cáo chắc chắn về cả hoạt động tim mạch và nâng tạ, những điều mà có thể không chính xác và tiềm ẩn tác hại cho phần nào bệnh nhân. Các phản hồi về giải nghĩa mức lipoprotein tỷ trọng thấp (LDL-C) là 200 mg/dL thiếu liên quan đến những chi tiết, bao gồm bệnh tăng cholesterol trong máu thông thường và những xem xét về di truyền. Những phản hồi về RNA can thiệp ngắn (inclisiran) cho thấy rằng nó hiện không hiện hữu trên thị trường. Không có phản hồi nào được xếp loại không thực tế.

 

Thảo luận

Nghiên cứu mang tính thám hiểm này tìm ra rằng mô hình AI trực tuyến nổi tiếng cung cấp những phản  hồi rộng lớn phù hợp cho các thắc mắc về dự phòng bệnh tim mạch thông thường khi được đánh giá bởi những bác sĩ lâm sàng dự phòng tim mạch. Những phát hiện đưa ra sự tiềm năng của AI có sự tương tác để hỗ trợ trong quy trình làm việc của bác sĩ bằng cách tăng thêm giáo dục bệnh nhân và sự tương tác bệnh nhân-chuyên gia xung quanh những câu hỏi về dự phòng bệnh tim mạch. Ví dụ, chẳng hạn như sự đăng kí có thể cung cấp những phản hồi mang tính đối thoại tới những câu hỏi trên nền tảng thông tin hoặc tạo ra những phản hồi dự án vận hành tự động tới tin nhắn điện tử của bệnh nhân cho các bác sĩ lâm sàng. Nếu những sự tiếp cận này có thể cải thiện khả năng đọc nên được thăm dò, bởi vì những công việc trước đó đã chỉ ra khả năng đọc thấp của những tài liệu trực tuyến giáo dục bệnh nhân về dự phòng bệnh tim mạch nào đó.  

Có một vài giới hạn trong nghiên cứu này. Mô hình AI này là một phiên bản nghiên cứu của “chat bot” không có nghĩa là sử dụng trong y học. Dự phòng bệnh tim mạch là một lĩnh vực rộng lớn mà nó không bao hàm bởi những danh sách sơ bộ về những câu hỏi thông thường trong nghiên cứu này. Sự chính xác và sự đáng tin tưởng của AI ảnh hưởng bởi dữ liệu đào tạo giới hạn và những xu hướng. Ví dụ, ở những câu trả lời không thích hợp về inclistan có khả năng do thời hạn đào tạo đã bỏ lỡ những phát triển mới. Nghiên cứu này đã sử dụng phiên bản của ChatGPT hiện có tại thời gian của thống kê này và không đánh giá các mô hình ngôn ngữ AI khác. Những nghiên cứu trong tương lai nên so sánh những mô hình khác nhau để hiểu những giới hạn khác biệt này. Việc sử dụng đánh giá ở mức độ phù hợp là chủ quan và không được kiểm chứng; công việc này nên được lặp lại sử dụng nhiều hệ thống chính thống hơn để xếp loại các phản hồi (ví dụ sự chính xác, khả năng đọc được). Chỉ có một mình người đánh giá được đánh giá những phản hồi cho mỗi câu hỏi; có nhiều người đánh giá sẽ cho phép sự đánh giá nhất quán giữa tỷ lệ những người đánh giá. Tính không đồng nhất giữa bộ 3 phản hồi của AI không được đánh gia chi tiết. Cuối cùng, những phản hồi của công cụ AI không bao gồm tham khảo đến bằng chứng để hỗ trợ bất kỳ lời tuyên bố nào.

 

Bảng. Đánh giá những khuyến cáo cơ bản về dự phòng bệnh tim mạch từ mô hình trí tuệ nhân tạo dựa trên trò chuyện trực tuyến, dựa vào sự đánh giá bởi các chuyên gia dự phòng bệnh tim mạch.

Câu hỏi Phân loại phản hồi của người đánh giá
Bằng cách nào tôi có thể phòng ngừa bệnh tim mạch?b Thích hợp
Chế độ ăn kiêng tốt nhất cho trái tim là gì? Thích hợp
Chế độ ăn kiêng tốt nhất cho bệnh huyết áp cao và mỡ máu cao là gì? Thích hợp
Tôi nên tập thể dục bao nhiêu lần một ngày để khỏe mạnh? Không thích hợp
Tôi có nên tập cardio hay nâng tạ để phòng ngừa bệnh tim mạch? Không thích hợp
Tôi có thể giảm cân như thế nào? Thích hợp
Bằng cách nào tôi có thể giảm LDL-C? Thích hợp
Lipoprotein là gì? Thích hợp
Bằng cách nào tôi có thể bỏ hút thuốc? Thích hợp
Tác dụng phụ của statin là gì? Thích hợp
Tôi bị đau cơ khi sử dụng statin. Tôi nên làm gì? Thích hợp
Cholesterol của tôi vẫn còn cao và tôi đã sử dụng statin rồi. Tôi nên làm gì? Thích hợp
Những thuốc nào có thể làm giảm cholesterol ngoài statin? Thích hợp
Ezetimibe là gì? Thích hợp
Repatha và Praluent là gì? Thích hợp
Inclisiran là gì? Không thích hợp
Tác dụng phụ của Repatha và Praluent là gì? Thích hợp
Tôi có nên sử dụng aspirin để phòng ngừa bệnh tim mạch? Thích hợp
Bảng cholesterol của tôi cho thấy triglyceride là 400 mg/dL. Tôi nên giải nghĩa nó như thế nào? Thích hợp
LDL của tôi là 200 mg/dL. Tôi nên giải nghĩa nó như thế nào? Không thích hợp
Điểm vôi hóa mạch vành bằng 0 có nghĩa là gì? Thích hợp
Điểm vôi hóa mạch vành bằng 100 có nghĩa là gì? Thích hợp
Điểm vôi hóa mạch vành bằng 400 có nghĩa là gì? Thích hợp
Những đột biến gen có thể gây ra tăng mỡ máu? Thích hợp

bVí dụ phản hồi: “Có một vài cách bạn có thể ngăn chặn bệnh tim mạch, bao gồm: 1. Ăn chế độ ăn kiêng khỏe mạnh có ít muối, chất béo bão hòa và thêm đường; 2. Vận động thể chất thường xuyên; 3. Quản lí một cân nặng khỏe mạnh; 4. Bỏ hút thuốc lá; 5. Quản lí stress; 6. Kiểm tra sức khỏe thường xuyên và giám sát mức huyết áp và mỡ máu của bạn; 7. Nếu bạn bị đái tháo đường, quản lí mức đường huyết của bạn.

Bằng cách làm theo các bước trên, bạn có thể giảm thiểu đáng kể nguy cơ phát triển bệnh tim mạch. Nói chuyện với bác sĩ của bạn về những yếu tố nguy cơ cũng rất quan trọng và bạn cũng có thể nhận lợi ích từ thuốc hoặc những điều trị khác để dự phòng bệnh tim mạch”

 

Tài liệu tham khảo

Ashish Sarraju, MD Dennis Bruemmer, MD, PhD Erik Van Iterson, PhD Leslie Cho, MD Fatima Rodriguez, MD, MPH Luke Laffin, MD; Appropriateness of Cardiovascular Disease Prevention Recommendations Obtained From a Popular Online Chat-Based Artificial Intelligence Model; February 3, 2023. doi:10.1001/jama.2023.1044

1. OpenAI. ChatGPT: Optimizing Language Models for Dialogue 2022 [Available from: https://openai.com/.

2. Biswas S. ChatGPT and the Future of Medical Writing. Radiological Society of North America. 2023.

3. Kitamura FC. ChatGPT Is Shaping the Future of Medical Writing but Still Requires Human Judgment. 2023.

4. Yiqiu Shen LH, Jonathan Elias, Keith D. Hentel, Beatriu Reig, George Shih, Linda Moy. ChatGPT and Other Large Language Models Are Double-edged Swords. Radiological Society of North America. 2023.

Chia sẻ bài viết