THE APPLICATION OF ARTIFICIAL INTELLIGENCE IN DENTISTRY - PART 1

ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG NHA KHOA

PHẦN 1. CÁC KHÁI NIỆM CĂN BẢN TRONG AI VÀ VAI TRÒ CỦA BÁC SĨ RĂNG HÀM MẶT TRONG NGHIÊN CỨU ỨNG DỤNG AI

Trí tuệ nhân tạo (Artificial Intelligence, gọi tắt là AI) là một lĩnh vực khá hot tại Việt Nam thời gian qua với sự nổi lên như một hiện tượng của trung tâm nghiên cứu VinAI thuộc tập đoàn Vingroup. Đây không chỉ là chủ đề mang tính trendy mà hứa hẹn mang đến những đột phá cho sự phát triển của xã hội và khoa học trong tương lai. Thực tế, ngày càng có nhiều ứng dụng AI trong lĩnh vực y tế.
Mục tiêu chính của bài viết này nhằm cập nhật một số thông tin (trong giới hạn hiểu biết của tác giả) đến các đồng nghiệp cũng như khơi gợi mối quan tâm cho các bạn trẻ mong muốn học tập, nghiên cứu và ứng dụng công nghệ này trong chuyên ngành thời gian tới. Biết đâu đây sẽ là hướng nghiên cứu mà các bạn theo đuổi cho các chương trình sau đại học của mình.

1. MỘT SỐ KHÁI NIỆM TRONG LĨNH VỰC AI 

Hình 1. Một số mốc lịch sử quan trọng trong sự phát triển của AI.
(Nguồn: https://miro.medium.com/max/700/0*jng0i9svVVe7L7sj)

AI - Artificial Intelligence (Trí tuệ nhân tạo) xuất hiện từ những năm 1950, dùng để mô tả ý tưởng xây dựng hệ thống máy móc có thể thực hiện các công việc mà trước đây do con người đảm nhận.
Machine learning (Học máy) là một lĩnh vực nhỏ của AI, trong đó người ta sử dụng các thuật toán (algorithm) để máy tính tự phân tích các đặc điểm và cấu trúc thống kê bên trong của một bộ dữ liệu. Kết quả tự phân tích này gọi là một trained model (mô hình đã được huấn luyện). Từ đó, con người có thể sử dụng model này để dự đoán kết quả (prediction) của một bộ dữ liệu mới mà máy tính chưa từng tiếp xúc (unseen data).
Thuật toán học máy phổ biến hiện nay là mạng lưới neuron nhân tạo (artificial neural networks, NNs) có độ chính xác cao hơn nhiều so với các thuật toán cổ điển, đặc biệt đối với dữ liệu có cấu trúc phức tạp, chẳng hạn như hình ảnh kỹ thuật số và ngôn ngữ tự nhiên.
Thành phần chính của bất kỳ mạng lưới neuron nào chính là các neuron nhân tạo, là một mô hình toán học phi tuyến tính (mathematical non-linear model) dựa trên ý tưởng từ các tế bào thần kinh của người. Dữ liệu đầu vào (input) được chuyển đổi thành thông tin số hóa dưới dạng các điểm đại diện (gọi là neuron), tập hợp các neuron này tạo thành một lớp (layer) dữ liệu. Thông qua các phép tính (mathematical operations) như phân cụm (stacking), kết nối (concatenating) các neuron trong một layer, các neuron này được chuyển đổi thành một lớp layer mới (tập hợp các neuron mới).
Tùy theo điều chỉnh của nhà lập trình, mà số lượng layer có thể từ vài đến vài trăm. Và thuật ngữ "deep learning" (Học sâu) dùng để chỉ các mạng lưới neuron đa lớp (multiplayered neural network architectures).
Hình 2. Minh họa mô hình AI nhận diện hình ảnh. (A) Các mô hình AI hiện nay được xem là "hộp đen" vì chúng tiếp nhận dữ liệu đầu vào (ví dụ, một hình ảnh bất kỳ) và đưa ra một kết quả dự đoán (ví dụ, gà trống) nhưng không hề đưa ra cách thức cũng như lý do vì sao có kết quả đó. (B) Tái phân bố kết quả đầu ra ngược lại dữ liệu đầu vào và giải thích kết quả bằng "bản đồ nhiệt" (heatmap), thị giác hóa các biến đầu vào (ví dụ, pixels) có tính quyết định đến kết quả dự đoán. (C) Hình ảnh và bản đồ nhiệt tương ứng lý giải vị trí nào có tính quyết định đến kết quả dự đoán, với chiến lược an toàn và ý nghĩa (gà trống, mèo) hoặc không hợp lý (ngựa).[1]
Có thể tham khảo thêm một số nội dung về AI trên kênh Youtube tiếng Việt tại đây để rõ hiểu hơn các khái niệm nêu trên dưới góc độ của các lập trình viên AI.

2. VAI TRÒ CỦA NHÂN SỰ NHA KHOA TRONG QUÁ TRÌNH ỨNG DỤNG AI

Trước hết, để giúp mọi người có cái nhìn rõ ràng và thực tế hơn về vai trò của nhân sự nha khoa (chủ yếu là Bác sĩ Răng Hàm Mặt - BS RHM) trong quá trình ứng dụng AI vào chuyên ngành, chúng ta sẽ cùng phân tích một ví dụ sau đây. Có nhiều loại dữ liệu trong thực hành nha khoa được lưu trữ hàng ngày như hồ sơ bệnh án, mẫu hàm, ảnh chụp, phim X-quang cổ điển và kỹ thuật số (KTS). 
Lấy ví dụ sử dụng AI để phát hiện sâu răng trên phim X-quang KTS. Mỗi hình ảnh X-quang KTS được cấu tạo bởi hàng ngàn điểm ảnh (pixel). Đây là dữ liệu đầu vào (input) cung cấp cho máy tính. Các chương trình AI trong máy tính sẽ "học" cách phân tích các hình ảnh KTS. Công việc này là một quy trình đòi hỏi sự hợp tác giữa kỹ sư phần mềmchuyên gia y tế (BS RHM, kỹ thuật viên chẩn đoán hình ảnh, v.v...). 
Trước hết, các BS có kinh nghiệm, chuyên gia sẽ xác định các mốc giải phẫu hoặc vị trí bất thường trên phim bằng cách thủ công (có hỗ trợ của máy tính) (thuật ngữ chuyên môn gọi là annotate - chú giải ảnh), hiểu nôm na là phân loại các hình ảnh X-quang thành nhiều nhóm, chẳng hạn nhóm sâu răng, nhóm nghi ngờ sâu răng, nhóm không sâu răng. Tập hợp toàn bộ hình ảnh đã phân loại này gọi chung là bộ dữ liệu (dataset), sau đó lại được chia thành 2 sub-dataset: 1 dùng để training cho máy tính (train set), 1 dùng để kiểm tra khả năng dự đoán của máy tính (test set). Đây có thể là giai đoạn tốn nhiều thời gian và công sức nhất trong toàn bộ quy trình phát triển một ứng dụng AI vào chuyên ngành.
Trong khi đó, các kỹ sư phần mềm sẽ thiết lập một thuật toán với các hiệu chỉnh phù hợp (gọi chung là algorithm). Train set được cung cấp cho máy tính gồm hình ảnh và nhóm phân loại của hình ảnh mà các chuyên gia đã chuẩn bị trước đó. Máy tính sử dụng algorithm để "học" - tìm ra điểm chung của các hình ảnh trong cùng phân nhóm là gì. Kết quả của quá trình huấn luyện hay "học" sẽ tạo ra một trained model (mô hình đã huấn luyện) có thể dự đoán được kết quả giống với kết quả của BS lâm sàng. 
Lúc này, chúng ta sẽ sử dụng đến test set. Test set cung cấp cho máy tính là một tập hợp hình ảnh ngẫu nhiên, chưa được phân loại. Độ chính xác của trained model sẽ được tính toán bằng cách đối chiếu kết quả dự đoán của nó với kết quả của BS lâm sàng (được chuẩn bị trong một file độc lập nhưng không cung cấp cho trained model) trên test set. Các chỉ số thường dùng là độ chính xác (accuracy), AUC (Area under the receiver operating characteristic curve).
Một ví dụ khác như hình bên dưới, sử dụng input là hình ảnh mô học KTS (Digital Pathology Image), thuật toán Deep machine learning là Inception-v3 của hãng Google và output là phân loại hình ảnh thành một trong bốn loại: bình thường, loạn sản nhẹ, loạn sản nặng và carcinôm tế bào gai.
 Hình 3. Quy trình tổng quát ứng dụng AI trong phân loại hình ảnh mô học niêm mạc miệng.
Nguồn: Dr. Harry

Đến đây, mọi người chắc đã hiểu rõ vai trò của BS RHM trong quá trình phát triển các ứng dụng AI vào chuyên ngành. Trong thực tế, BS không phải là người chịu trách nhiệm chính về mặt kỹ thuật mà là ở chất lượng của dữ liệu đầu vào. Bởi lẽ, nếu dữ liệu không chính xác thì máy tính sẽ "học" sai, đưa đến độ chính xác cũng thấp, dù cho thuật toán có tốt cỡ nào. 
Hãy tưởng tượng BS là thầy giáo và thuật toán trong máy tính là đứa học trò. Nếu thầy cho nhiều bài tập đồng dạng (input) và đáp án đúng (kết quả đúng) thì đứa học trò có thể suy luận và tìm ra quy luật chung, sau đó chúng có thể tìm đáp án cho một bài toán mới tương tự. Vậy nên, nếu thầy cho đáp án sai, thì học trò không thể tìm ra được quy luật, cũng như máy tính sẽ đưa ra một mô hình dự đoán sai lầm, có độ chính xác thấp. Dĩ nhiên, mỗi đứa học trò (tượng trưng cho một thuật toán) sẽ có những cách suy nghĩ khác nhau để tìm ra quy luật của bài toán, tùy cách suy luận mà sẽ tìm ra đáp án nhanh hay chậm, tương tự thuật toán được đánh giá dựa trên tốc độ đưa ra dự đoán và độ chính xác của dự đoán.
Tuy nhiên, dù không phải chịu trách nhiệm về kỹ thuật, nhưng việc hiểu biết khái lược về các thuật toán AI, cách vận hành các mô hình sẽ giúp sự phối hợp của BS với kỹ sư nhịp nhàng hơn, có được tiếng nói chung trong việc tìm cách giải quyết các vấn đề dựa trên dữ liệu chuyên ngành, từ đó hiểu được và lý giải kết quả dự đoán của máy tính tốt hơn.
Mình biết có một số bạn học Y-Nha nhưng lại đam mê IT, đã tự học thêm các ngôn ngữ lập trình. Điều này có thể không dễ dàng với tất cả mọi người, nhưng không phải là điều không thể làm được. Trong một chia sẻ trên Youtube, một bạn AI Researcher có nói người ngoài ngành CNTT (hay IT) (cơ khí, y khoa, kinh tế, v.v...) có khó khăn hơn khi muốn trở thành một AI researcher nhưng vẫn có thể học nếu đủ đam mê và quyết tâm. Thực tế, bản thân mình dù không phải là người yêu thích lập trình cũng đã và đang dấn thân vào con đường ấy do một số cơ duyên phù hợp. Vậy nên, nếu yêu thích programming, nếu mong muốn tìm kiếm cơ hội mới trong lĩnh vực AI, tại sao các bạn trẻ đang theo học nha khoa không chuẩn bị cho mình hành trang cần thiết để bước vào cuộc đua này? Sử dụng công nghệ hiện đại vào chuyên ngành quá thú vị phải không nè! 
Trong các phần tiếp theo, mình sẽ giới thiệu qua một số ứng dụng của AI trong lĩnh vực RHM (Phần 2) và quá trình học và các học liệu mà mình đã sử dụng để tự học cách ứng dụng AI vào chuyên ngành của mình như thế nào (Phần 3). Hãy cùng đón xem nhé! 

BÀI VIẾT LIÊN QUAN 

Tài liệu tham khảo

  1. Chen Yo-wei, Stanley Kyle, Att Wael. Artificial intelligence in dentistry: current applications and future perspectives. Quintessence Int 51 (2020), No. 3, p.248-257, doi:10.3290/j.qi.a43952.
  2. F. Schwendicke, W. Samek, J. Krois. Artificial Intelligence in Dentistry: Chances and ChallengesJournal of Dental Research (2020), Vol. 99(7) 769–774. https://doi.org/10.1177/0022034520915714.
  3. https://healthcareinamerica.us/the-future-of-artificial-intelligence-in-dentistry-114e04fc4e8f
  4. https://www.dentaleconomics.com/macro-op-ed/article/16386252/how-artificial-intelligence-is-shaping-dentistry#:~:text=In%20dentistry%2C%20AI%20is%20being%20used%20for%20different%20applications.&text=Because%20computers%20are%20able%20to,this%20way%20is%20Dentistry.ai.
  5. https://www.aegisdentalnetwork.com/idt/2019/07/artificial-intelligence-in-dentistry

Nhận xét

Bài đăng phổ biến