USE OF ARTIFICIAL INTELLIGENCE IN DIAGNOSIS OF HEAD AND NECK PRECANCEROUS AND CANCEROUS LESIONS: A SYSTEMATIC REVIEW

SỬ DỤNG TRÍ TUỆ NHÂN TẠO TRONG CHẨN ĐOÁN TỔN THƯƠNG TIỀN UNG VÀ UNG THƯ VÙNG ĐẦU CỔ: TỔNG QUAN HỆ THỐNG

Bài viết lượt dịch từ bài báo "Use of artificial intelligence in diagnosis of head and neck precancerous and cancerous lesions: A systematic review", đăng trên tạp chí Oral Oncology, năm 2020.


GIỚI THIỆU

Ung thư đầu cổ (UTĐC) (head and neck cancer) là một nhóm nhiều loại ung thư, thường gặp nhất là carcinôm tế bào gai (squamous cell carcinoma - SCC) (chiếm 90%) của khoang miệng (oral cavity), khoang mũi (nasal cavity), các xoang (sinuses), tuyến nước bọt (salivary glands), hầu (pharynx) và thanh quản (larynx). Yếu tố nguy cơ nguyên phát bao gồm sử dụng thuốc lá (tobacco), hạt cau (betel nut), cồn (alcohol), bức xạ (radiation), suy giảm miễn dịch (immunodeficiency) và một số virus đặc hiệu như Human Papillomavirus (HPV) 16 và 18 (đối với SCC khẩu-hầu/hầu-miệng) và Epstein-Barr virus (đối với SCC tị-hầu/hầu-mũi). Phơi nhiễm mạn tính các tác nhân sinh ung trên hoặc tình trạng nhiễm virus kéo dài có thể dẫn đến thay đổi loạn sản (dysplastic changes) trong niêm mạc vùng miệng, hầu-miệng (oropharyngeal), mũi và hầu-mũi (nasopharyngeal), có thể phát triển thành UTĐC. Tỉ lệ mới mắc (incidence) của UTĐC tiếp tục gia tăng và đứng ở vị trí thứ 6 trong các nhóm ung thư trên toàn cầu. Theo uớc tính năm 2018, UTĐC chiếm hơn 650.000 ca mắc mới và 33.000 ca tử vong hằng năm trên toàn thế giới. Tại Vương quốc Anh, số ca mắc mới tăng 22% trong vòng một thập kỷ, với gần 12.000 ca mới mỗi năm (33 ca mỗi ngày).

Mặc dù có những bước tiến về kỹ thuật y khoa và phẫu thuật (medical and surgical techniques), tiên lượng (prognosis) UTĐC thường kém với tỉ lệ sống còn 5 năm (five-year survival rate) từ 28-67%. Do có biểu hiện trễ, thậm chí khi điều trị thành công cũng có liên quan đến sự suy giảm đa chức năng như nhai, nói và nuốt làm giảm đáng kể chất lượng sống của người bệnh. Vì vậy, chẩn đoán sớm các tổn thương có tiềm năng hóa ác vùng đầu-cổ có thể phòng ngừa sự phát triển ung thư lên đến 88% trường hợp. Tuy nhiên, hầu hết bệnh nhân (BN) được chẩn đoán ở giai đoạn trễ (62% ở giai đoạn III và IV). Các phương thức chẩn đoán cổ điển bao gồm đánh giá lâm sàng, X-quang và mô bệnh học (clinical, radiological and histopathological assessment). Trong đó, khâu cuối cùng là tiêu chuẩn vàng (gold standard) cung cấp các dữ kiện tiên lượng quan trọng (chẳng hạn, phân độ loạn sản và ung thư) hướng đến quyết định điều trị. Tuy nhiên, lý giải mô bệnh học mang tính chủ quan và không thống nhất có thể làm giảm hiệu quả quản lý và phân loại nguy cơ. Điều này nhấn mạnh tầm quan trọng của các phương thức và kỹ thuật mới có độ đồng nhất cao (consistency), chẩn đoán hiệu quả và chính xác giúp đưa ra quyết định lâm sàng (clinical decision-making) và cải thiện tỉ lệ sống còn của BN UTĐC.

Trong vòng một thập kỷ vừa qua, trí tuệ nhân tạo (Artifiical Intelligence - AI) đã và đang trở nên phổ biến trong nghiên cứu ung thư và cho thấy khả năng gia tăng độ chính xác và hiệu suất chẩn đoán thông qua việc cung cấp dữ kiện đầu ra (output) để dự đoán tiên lượng và đáp ứng của ung thư. Học máy (Machine learning - ML), một nhánh của AI, cho thấy khả năng làm giảm độ biến thiên trong phân độ loạn sản và ung thư giúp chuẩn hóa và đảm bảo tính thống nhất để đưa ra quyết định điều trị. ML sử dụng các phương pháp tính toán (computational methods) để "học" thông tin và các đặc tính trực tiếp từ dữ liệu. Quá trình học này có thể "có giám sát" (supervised) (tức là liên quan đến huấn luyện các mô hình ML trên dữ liệu đầu vào và đầu ra đã biết, ví dụ, các lam mô học đã được xác định chẩn đoán) hoặc "không giám sát" (unsupervised) (tức liên quan đến quá trình khai thác và trích xuất các đặc điểm tiềm ẩn từ dữ liệu đầu vào mà không được cung cấp bất kỳ thông tin liên quan nào khác). Các thuật toán ML (ML algorithms) cải thiện năng lực (performance) dự đoán theo hướng thích nghi khi tăng dần số lượng mẫu dùng cho hệ thống tự huấn luyện, chủ yếu theo cách "học từ kinh nghiệm" (learn from experience). 

Tiếp cận ML có giám sát cổ điển (classical supervised ML approaches) bao gồm hai kỹ thuật là phân lập (sematic segmentation) và phân loại (classification). Phương pháp "phân lập" liên quan đến việc phân chia một file ảnh kỹ thuật số chất lượng cao của toàn bộ lam mô học (whole slide image - WSI) thành từng khu vực tương ứng với lâm sàng, tiếp theo là cắt WSI thành từng mảnh nhỏ (patch/ subimage) thông qua quá trình "patch extraction". Việc này tạo tiền đề để các thuật toán ML tính toán các đặc điểm khu trú cũng như toàn thể trong các file ảnh để tự khám phá mối liên hệ có ý nghĩa bên trong dữ liệu qua giai đoạn học tập và huấn luyện (learning and training). Phương pháp "phân loại" liên quan đến việc tổ chức và phân loại các quan sát mới có được dựa trên các thuộc tính đặc hiệu (ví dụ, hình thái của nhân tế bào) mà thuật toán học được từ dữ liệu đầu vào trước đó. Cả hai kỹ thuật này được sử dụng phổ biến trong nghiên cứu ung thư, truy xuất các dữ kiện đầu ra hữu ích cho chẩn đoán và tiên lượng. 

Với sự tiến triển về năng lực tính toán của máy tính và các thuật toán phân tích hình ảnh, hiện nay, có sự gia tăng số lượng bằng chứng chứng minh sự thành công của phân tích hình ảnh bằng AI từ WSI. Một số nghiên cứu cho thấy tiềm năng của AI trong dự đoán đáng tin cậy chẩn đoán, tiên lượng, tình trạng đột biến (mutational status) và đáp ứng điều trị trong một loạt các ung thư đường ruột (colorectal), phổi, da và vú.  Những nghiên cứu này nhấn mạnh tiềm năng của các phương pháp sử dụng AI vì thông tin liên quan đến chẩn đoán và tiên lượng ung thư thu được nhanh chóng, đồng nhất, chính xác và tái thực hiện được, góp phần bổ sung cho phân tích mô bệnh học truyền thống bằng kính hiển vi quang học (light micrscopy) và bác sĩ giải phẫu bệnh có kinh nghiệm (experienced pathologist).

Tình trạng gia tăng đáng báo động tỉ lệ mắc mới UTĐC toàn cầu và tiên lượng kém khiến việc ứng dụng các phương pháp trên nền tảng AI trong hỗ trợ chẩn đoán khách quan và cung cấp thông tin tiên lượng có giá trị đang là xu hướng lý tưởng. Nhóm tác giả đã thực hiện tổng quan hệ thống này với các y văn công bố trong vòng 10 năm gần đây để đánh giá việc sử dụng và độ chính xác trong chẩn đoán của AI/ML trong phát hiện và phân độ các tổn thương tiềm năng hóa ác và ung thư vùng đầu-cổ. Theo hiểu biết của nhóm tác giả, đây là tổng quan đầu tiên về chủ đề sử dụng các phương pháp AI trong tổn thương vùng đầu-cổ.

TÓM TẮT PHƯƠNG PHÁP VÀ KẾT QUẢ TÌM KIẾM

Quy trình thực hiện tổng quan dựa theo khuyến cáo PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-analyses) và checklist28. Các cơ sở dữ liệu tìm kiếm bao gồm MEDLINE/OVID, Scopus, Web of Sciences và Cochrane library, ngôn ngữ là tiếng Anh, thời gian đăng tải từ tháng 10/2009 đến tháng 4/2020.

Từ kết quả ban đầu gồm 315 bài báo, có 11 bài thỏa mãn các tiêu chí của tổng quan được phân tích toàn diện. Sử dụng AI phân tích hình ảnh mô học của loạn sản biểu mô miệng (oral epithelial dysplasia) (n=1), u sợi dưới niêm (oral submucous fibrosis) (n = 5), SCC (n=4) và SCC hầu-miệng (n=1). Các nghiên cứu sử dụng nhiều thuật toán khác nhau, bao gồm có và không có giám sát. Hầu hết các nghiên cứu sử dụng kho dữ liệu đơn trung tâm (unicentric datasets) (từ 40-270 hình ảnh WSI). Độ chính xác về dự đoán của thuật toán dao động từ 79-100%.

Phân loại các thuật toán AI được sử dụng trong 11 nghiên cứu. Nguồn: cùng bài báo.

BÀN LUẬN

Để việc ứng dụng các phương pháp dựa trên AI hiệu quả và an toàn trong chẩn đoán và thực hành lâm sàng, cần phải tiến hành lượng giá các thuật toán bằng các thử nghiệm phù hợp. Trong đó bao gồm nguồn dữ liệu đầu vào có tính đại diện về mặt lâm sàng và có thể đánh giá định lượng được. Một bộ dữ liệu lý tưởng cần có tính đại diện trong thực hành lâm sàng được lấy từ toàn bộ mẫu mô được cắt. Các mẫu mô đa trung tâm sẽ tăng độ đa dạng và biến thể sinh học cho mẫu nghiên cứu về vị trí địa lý (geographical location), dân số BN (patient population) và đặc điểm nhân khẩu học (demographics). Hơn nữa, dữ liệu đối chiếu nền (ground truth) cần được xác định tỉ mỉ từ nhiều bác sĩ giải phẫu bệnh để hạn chế tối đa tính chủ quan và sự khác biệt giữa các bác sĩ. Trong các thuật toán ML có giám sát, bộ dữ liệu lý tưởng nên được phân thành ba nhóm: (1) dùng để huấn luyện mô hình AI, (2) để tối ưu hóa mô hình AI (optimal model selection) và (3) để đánh giá hoặc lượng giá (evaluation or validation). Hầu hết các nghiên cứu ở đây chỉ sử dụng hai nhóm dữ liệu để đánh giá. Điều này làm gia tăng độ sai lệch, góp phần dẫn đến kết quả có độ chính xác cao (từ 79-100%).

Hầu hết các nghiên cứu được đánh giá đăng tải trước năm 2015, do đó, chủ yếu sử dụng các thuật toán ML cổ điển. Điều này khá ngạc nhiên vì lĩnh vực AI và ML tiến triển đáng kể trong vòng một thập niên vừa qua, có nhiều thuật toán hiện đại đã phát triển hỗ trợ tốt cho nhiều vấn đề như phát hiện vật thể trong tự nhiên (object detection in natural), nhận diện giọng nói (human voice recognition) và xử lý ngôn ngữ (natural language processing). Tuy nhiên, tổng quan này cho thấy các thuật toán AI này chưa được ứng dụng trong phát hiện tổn thương vùng đầu-cổ vốn có tỉ lệ mới mắc tăng cao và tiên lượng kém. Bên cạnh đó, các kỹ thuật học sâu (deep learning) tùy chỉnh đã và đang được sử dụng để phân lập hình ảnh chứa biểu mô và tế bào cho thấy những thành công bước đầu trong phân tích hình thái của UTĐC.

KẾT LUẬN

Nhìn chung, chất lượng bằng chứng còn thấp, hầu hết các nghiên cứu có nguy cơ sai lệch cao (high risk of bias) theo hướng đánh giá cao (overestimate) độ chính xác của thuật toán. Tổng quan này nhấn mạnh cần phát triển các kỹ thuật học máy hiện đại trong các nghiên cứu liên quan đến UTĐC thời gian tới.

BÀI VIẾT LIÊN QUAN

PHẦN 1. CÁC KHÁI NIỆM CĂN BẢN TRONG AI VÀ VAI TRÒ CỦA BÁC SĨ RĂNG HÀM MẶT TRONG NGHIÊN CỨU ỨNG DỤNG AI
PHẦN 2. MỘT SỐ ỨNG DỤNG TRONG NHA KHOA
PHẦN 3. HỌC LIỆU ĐỂ TỰ HỌC VÀ ỨNG DỤNG AI TRONG LĨNH VỰC RĂNG HÀM MẶT 

Nhận xét

Chuồng của múp đã nói…
Dạ theo em được biết thì ví dụ BN tại khoa (Răng Hàm Mặt) sau khi thường sinh thiết và có kết quả giải phẩu bệnh thì sẽ được chuyển sang khoa ung bướu để tiếp tục điều trị ạ? Nên em tưởng ứng dụng này thuộc hệ ung bướu cơ
Harry nguyen đã nói…
Chào bạn, quy trình chẩn đoán và điều trị bệnh khác nhau tùy cơ sở y tế, khu vực, quốc gia, không phải phân chia hệ Răng Hàm Mặt hay hệ Ung Bướu. Ứng dụng AI trình bày trong bài này là chẩn đoán tổn thương ở vùng đầu cổ, còn ứng dụng ở đâu là tùy theo quy trình ở đó. Khoa Răng Hàm Mặt (mà bạn đề cập) không có chuyên khoa ung bướu nên phải chuyển đi, còn các bệnh viện Răng Hàm Mặt Trung Ương hay bệnh viện tuyến Trung Ương thì vẫn thực hiện khám và điều trị được ung thư đầu cổ từ đầu đến cuối.

Bài đăng phổ biến