MONAI (Medical Open Network for AI) là một khung nền mã nguồn mở, được cộng đồng hỗ trợ, chuyên biệt cho học sâu trong hình ảnh y tế. Mục đích chính của nó là tăng tốc và đơn giản hóa việc ứng dụng học sâu trong lĩnh vực chuyên biệt này. Nền tảng này cung cấp một bộ sưu tập các triển khai thuật toán học sâu và tiện ích được tối ưu hóa theo miền. Dự án này hướng tới việc thiết lập một cộng đồng các nhà nghiên cứu AI để phát triển và trao đổi các phương pháp hay nhất cho AI trong hình ảnh y tế, thúc đẩy khả năng tái tạo và mở rộng. Nó kết nối các bác sĩ với các nhà khoa học dữ liệu để khai thác sức mạnh của dữ liệu y tế, xây dựng các mô hình học sâu và các ứng dụng có thể triển khai cho các quy trình làm việc AI y tế.
Sự cần thiết của MONAI: Giải quyết các thách thức độc đáo trong hình ảnh y tế
Hình ảnh y tế đặt ra những thách thức độc đáo do định dạng phức tạp của chúng (ví dụ: DICOM, NIfTI), bản chất đa chiều (2D, 3D, 4D), và các yêu cầu cụ thể của các tác vụ như phân đoạn, phân loại và đăng ký. Các khung học sâu tổng quát thường thiếu các công cụ chuyên biệt và quy trình làm việc được tối ưu hóa cần thiết cho những sự phức tạp này. MONAI lấp đầy khoảng trống này bằng cách cung cấp các giải pháp tùy chỉnh để xử lý dữ liệu hình ảnh y tế phức tạp, cung cấp các hàm mất mát tập trung vào hình ảnh y tế (ví dụ: DiceLoss, TverskyLoss) và các kiến trúc mạng thần kinh được xây dựng sẵn được thiết kế cho dữ liệu y tế không gian. Khung nền này được thiết kế để tăng tốc quá trình xử lý và đánh giá các phương thức như X-quang, chụp cắt lớp vi tính (CT), chụp cộng hưởng từ (MRI), siêu âm, y học hạt nhân và bệnh lý kỹ thuật số, điều này rất cần thiết để quản lý khối lượng công việc của bác sĩ lâm sàng và cải thiện kết quả sức khỏe.
Nền tảng: Được xây dựng trên PyTorch
MONAI được xây dựng trực tiếp trên PyTorch, một thư viện học sâu phổ biến. Nền tảng này cho phép MONAI tận dụng tính linh hoạt và hệ sinh thái rộng lớn của PyTorch, đồng thời mở rộng nó với các khả năng chuyên biệt cho hình ảnh y tế.
Việc lựa chọn PyTorch làm nền tảng mang lại một lợi thế chiến lược đáng kể. PyTorch được công nhận rộng rãi về tính linh hoạt, biểu đồ tính toán động và giao diện Pythonic, khiến nó trở thành lựa chọn ưu tiên cho nghiên cứu học sâu. Bằng cách tận dụng PyTorch làm cơ sở, MONAI hưởng lợi từ cơ sở hạ tầng mạnh mẽ, cộng đồng nhà phát triển tích cực và những tiến bộ liên tục của nó, tránh được nhu cầu phát triển và duy trì một backend học sâu cốt lõi từ đầu. Lựa chọn chiến lược này cho phép MONAI nhanh chóng tích hợp các tiến bộ học sâu tiên tiến từ hệ sinh thái PyTorch rộng lớn hơn, đồng thời dành nguồn lực của mình để phát triển các tính năng hình ảnh y tế chuyên biệt cao. Điều này làm giảm đáng kể rào cản gia nhập cho những người dùng PyTorch hiện có quan tâm đến AI y tế và đảm bảo tính khả thi lâu dài, hiệu suất và khả năng mở rộng của khung nền, vì nó có thể dựa vào các thế mạnh nền tảng của PyTorch.
MONAI được mô tả rõ ràng là “mã nguồn mở, được cộng đồng hỗ trợ” và hướng tới việc “thiết lập một cộng đồng các nhà nghiên cứu AI để phát triển và trao đổi các phương pháp hay nhất”. Bằng chứng về sức mạnh cộng đồng của nó bao gồm “220 người đóng góp từ khắp nơi trên thế giới” và được ghi nhận trong “hơn 3.000 ấn phẩm”. Điều này làm nổi bật sự nhấn mạnh mạnh mẽ vào phát triển hợp tác và chia sẻ kiến thức. Bản chất mã nguồn mở và được cộng đồng thúc đẩy của MONAI là nền tảng cho việc áp dụng rộng rãi và tác động của nó. Nó thúc đẩy tính minh bạch, cho phép lặp lại nhanh chóng và sửa lỗi, đồng thời đảm bảo rằng khung nền phát triển để đáp ứng nhu cầu đa dạng và luôn thay đổi của các nhà nghiên cứu và bác sĩ lâm sàng trên toàn cầu. Mô hình hợp tác này tăng tốc tốc độ nghiên cứu AI y tế bằng cách giảm các nỗ lực trùng lặp và thúc đẩy các công cụ và phương pháp hay nhất được chia sẻ, cuối cùng dẫn đến các kết quả mạnh mẽ hơn, có thể tái tạo và liên quan đến lâm sàng hơn trong một lĩnh vực mà sự tin cậy, xác nhận và tiến bộ chung là tối quan trọng.
Hệ sinh thái MONAI: Các thành phần cốt lõi
MONAI Core: Thư viện nền tảng cho phát triển, đào tạo và đánh giá mô hình học sâu
MONAI Core là khung nền chính, miễn phí, dựa trên PyTorch, cung cấp các khả năng nền tảng được tối ưu hóa theo miền để phát triển các quy trình đào tạo hình ảnh chăm sóc sức khỏe. Nó cung cấp một bộ công cụ toàn diện cho xử lý tập dữ liệu, tải, triển khai mô hình học sâu (DL) và đánh giá. Các chức năng chính bao gồm các phép biến đổi y tế chuyên biệt được tối ưu hóa cho dữ liệu 2D, 3D và 4D, bộ nhớ đệm thông minh để tải dữ liệu nhanh hơn, hỗ trợ các định dạng DICOM, NIFTI và PNG/JPEG, và các quy trình có thể tái tạo. Nó cũng bao gồm các mô hình tiên tiến, các mô hình được đào tạo trước (hơn 31 mô hình trong Model Zoo), và lựa chọn mô hình tự động với Auto3DSeg. MONAI Core cung cấp các số liệu chuyên biệt (Dice, Hausdorff), các hàm mất mát chuyên biệt cho y tế, và các kiến trúc hình ảnh y tế tiên tiến.
MONAI Label: Công cụ chú thích thông minh được hỗ trợ bởi AI để tạo tập dữ liệu hình ảnh y tế chất lượng cao
MONAI Label là một công cụ chú thích và học tập hình ảnh thông minh tận dụng sự hỗ trợ của AI để giảm thời gian và công sức cần thiết cho việc chú thích các tập dữ liệu mới. Nó liên tục học hỏi và cải thiện mô hình AI của mình dựa trên tương tác của người dùng và các hình ảnh được chú thích bổ sung. Nó cung cấp các tính năng như chú thích được hỗ trợ bởi AI, học liên tục và tích hợp liền mạch với các nền tảng hình ảnh y tế như 3D Slicer, trình xem OHIF cho X-quang, QuPath và Digital Slide Archive cho bệnh lý học. Các nhà phát triển cũng có thể tích hợp nó vào các trình xem tùy chỉnh thông qua các API được trừu tượng hóa và tài liệu hóa. MONAI Label cung cấp các giải pháp chuyên biệt theo miền cho X-quang (phân đoạn cơ quan, phát hiện khối u), Bệnh lý học (phát hiện tế bào, phân loại mô), và Nội soi (phát hiện polyp, theo dõi công cụ).
MONAI Deploy App SDK: Tạo điều kiện chuyển đổi mô hình AI từ nghiên cứu sang môi trường sản xuất lâm sàng
MONAI Deploy App SDK được thiết kế để trở thành tiêu chuẩn để phát triển, đóng gói, kiểm tra, triển khai và chạy các ứng dụng AI y tế trong sản xuất lâm sàng. Nó thu hẹp khoảng cách từ nghiên cứu đến sản xuất lâm sàng. Nó cho phép các nhà phát triển biến các mô hình AI thành các ứng dụng AI có thể triển khai chỉ với vài dòng mã. Đáng chú ý, Siemens Healthineers đã áp dụng MONAI Deploy để tăng tốc tích hợp quy trình làm việc AI vào các nền tảng hình ảnh doanh nghiệp Syngo Carbon và syngo.via của họ, giảm thời gian triển khai từ nhiều tháng xuống chỉ còn vài cú nhấp chuột. Nó bao gồm các triển khai tham chiếu mở cho điều phối suy luận, cổng thông tin (tạo điều kiện tích hợp DICOM), và các trình quản lý quy trình làm việc.
MONAI Model Zoo: Kho lưu trữ các mô hình hình ảnh y tế được đào tạo trước, có thể tái tạo
MONAI Model Zoo là một bộ sưu tập các mô hình hình ảnh y tế được đào tạo trước, được đóng gói theo định dạng MONAI Bundle, đảm bảo khả năng tái tạo và dễ sử dụng. Các mô hình này bao gồm một loạt các tác vụ từ phân đoạn (ví dụ: khối u não, cơ quan bụng, tuyến tụy) đến phân loại (ví dụ: mật độ mô vú, phát hiện khối u bệnh lý) và tạo hình ảnh (ví dụ: X-quang tổng hợp, hình ảnh CT 3D). Nó đóng vai trò là nơi để các nhà nghiên cứu và khoa học dữ liệu sử dụng và chia sẻ các mô hình mới nhất từ cộng đồng.
Các thành phần riêng biệt của MONAI (Core, Label, Deploy, Model Zoo) không được trình bày như các công cụ riêng lẻ mà được thiết kế rõ ràng để hoạt động cùng nhau, bao quát “toàn bộ quy trình xây dựng ứng dụng hình ảnh y tế”. Ví dụ, MONAI Label tạo ra các tập dữ liệu được chú thích để đưa vào MONAI Core để đào tạo mô hình, và các mô hình thu được sau đó có thể được đóng gói và triển khai bằng MONAI Deploy. Model Zoo cung cấp các mô hình được xây dựng sẵn có thể khởi động bất kỳ giai đoạn nào trong số này. Điều này cho thấy một triết lý thiết kế tích hợp, có chủ ý chứ không phải là một bộ sưu tập các công cụ ngẫu nhiên. Thiết kế hiệp đồng này giúp hợp lý hóa đáng kể quy trình phát triển và triển khai AI trong hình ảnh y tế. Nó giảm bớt chi phí chung và các vấn đề tương thích liên quan đến việc tích hợp các công cụ rời rạc, vốn là một nút thắt lớn trong các lĩnh vực phức tạp và được quản lý như chăm sóc sức khỏe. Cách tiếp cận toàn diện này tăng tốc việc chuyển đổi các đổi mới nghiên cứu sang thực hành lâm sàng, bằng chứng là việc Siemens Healthineers tăng tốc tích hợp AI bằng cách sử dụng MONAI Deploy. Nó cũng ngụ ý sự hiểu biết toàn diện của các nhà phát triển MONAI về toàn bộ quy trình làm việc thực tế cần thiết cho AI y tế, không chỉ là lõi thuật toán.
Sự nhấn mạnh mạnh mẽ vào MONAI Deploy App SDK cho “sản xuất lâm sàng” và “thu hẹp khoảng cách từ nghiên cứu đến sản xuất lâm sàng” là rất quan trọng. Ví dụ cụ thể về việc Siemens Healthineers áp dụng MONAI Deploy để giảm thời gian tích hợp AI từ “nhiều tháng” xuống “chỉ vài cú nhấp chuột” làm nổi bật rõ ràng một điểm khó khăn quan trọng trong AI y tế: đưa các mô hình ra khỏi phòng thí nghiệm nghiên cứu và vào sử dụng lâm sàng thực tế. Sự tồn tại và ứng dụng thành công trong thế giới thực của MONAI Deploy chứng tỏ sự hiểu biết sâu sắc về các thách thức thực tế trong AI y tế, đặc biệt là vấn đề “chặng cuối” của việc triển khai và tích hợp vào các quy trình làm việc lâm sàng hiện có. Sự tập trung vào tích hợp lâm sàng và dễ triển khai này là rất quan trọng đối với tác động trong thế giới thực và việc áp dụng rộng rãi AI trong chăm sóc sức khỏe. Nó cho thấy MONAI không chỉ dành cho nghiên cứu học thuật mà còn là một giải pháp mạnh mẽ và có thể mở rộng cho các ứng dụng công nghiệp và lâm sàng, trực tiếp góp phần cải thiện kết quả sức khỏe bằng cách giúp các mô hình AI tiếp cận được với các bác sĩ lâm sàng nhanh hơn và hiệu quả hơn.
Bảng 1: Các thành phần chính của MONAI và chức năng chính của chúng
Thành phần MONAI | Chức năng/Mục đích chính | Các tính năng/Khả năng chính | Người dùng mục tiêu/Giai đoạn trong Vòng đời AI |
MONAI Core | Thư viện nền tảng cho phát triển, đào tạo và đánh giá mô hình học sâu trong hình ảnh y tế. | Biến đổi y tế chuyên biệt (2D, 3D, 4D), bộ nhớ đệm thông minh, hỗ trợ DICOM/NIfTI, mô hình tiên tiến (VISTA-3D, UNet), hàm mất mát chuyên biệt (DiceLoss), số liệu đánh giá (Dice, Hausdorff), tăng tốc hiệu suất (AMP, phân tán). | Nhà nghiên cứu, nhà phát triển AI (Giai đoạn phát triển mô hình & đào tạo) |
MONAI Label | Công cụ chú thích thông minh được hỗ trợ bởi AI để tạo tập dữ liệu hình ảnh y tế chất lượng cao. | Chú thích được hỗ trợ bởi AI, học liên tục, tích hợp với 3D Slicer/OHIF/QuPath, giải pháp chuyên biệt cho X-quang, Bệnh lý học, Nội soi. | Bác sĩ lâm sàng, nhà nghiên cứu, người chú thích dữ liệu (Giai đoạn chuẩn bị dữ liệu & chú thích) |
MONAI Deploy App SDK | Tạo điều kiện chuyển đổi mô hình AI từ nghiên cứu sang môi trường sản xuất lâm sàng. | Đóng gói, kiểm tra, triển khai và chạy ứng dụng AI y tế trong sản xuất, tích hợp với các nền tảng lâm sàng (ví dụ: Siemens Healthineers), tăng tốc tích hợp AI. | Nhà phát triển, kỹ sư triển khai, nhà cung cấp giải pháp y tế (Giai đoạn triển khai & tích hợp) |
MONAI Model Zoo | Kho lưu trữ các mô hình hình ảnh y tế được đào tạo trước, có thể tái tạo, đóng gói dưới dạng MONAI Bundle. | Bộ sưu tập các mô hình được đào tạo trước cho phân đoạn (khối u, cơ quan), phân loại (mật độ mô), đăng ký, tạo hình ảnh (X-quang, CT 3D tổng hợp). | Nhà nghiên cứu, nhà khoa học dữ liệu, nhà phát triển (Giai đoạn khám phá mô hình & sử dụng lại) |
Các tính năng chính và khả năng kỹ thuật
Xử lý dữ liệu và tiền xử lý nâng cao
Các mô-đun monai.transforms
và monai.data
của MONAI cung cấp các API chuyên biệt theo miền cho nhiều ứng dụng học sâu khác nhau, bao gồm các phép biến đổi hình ảnh cơ bản và các quy trình tiền xử lý phức tạp. Các phép biến đổi này được tối ưu hóa cho dữ liệu hình ảnh y tế 2D, 3D và 4D. Chúng hỗ trợ cả kiểu mảng và từ điển, cho phép các hoạt động đồng bộ hóa trên các phương thức khác nhau và đầu vào giám sát mô hình.
MONAI cung cấp I/O hình ảnh mạnh mẽ với các backend tích hợp hỗ trợ nhiều định dạng như DICOM, NIfTI và PNG/JPEG, đồng thời dễ dàng mở rộng cho các trình đọc định dạng tùy chỉnh. monai.data.MetaTensor
là cấu trúc dữ liệu cốt lõi kết hợp các API Tensor gốc của PyTorch với khả năng xử lý siêu dữ liệu, cho phép các mô hình và quy trình học sâu dễ dàng tích hợp thông tin siêu dữ liệu. Điều này rất quan trọng để duy trì ngữ cảnh và nguồn gốc của hình ảnh y tế trong suốt quy trình xử lý phức tạp.
MONAI triển khai nhiều cơ chế lấy mẫu dựa trên các vá hình ảnh khác nhau, bao gồm các phương pháp nâng cao như lấy mẫu cân bằng theo lớp, có trọng số từ các bản đồ trọng số lấy mẫu do người dùng chỉ định. Nó cũng hỗ trợ các phép biến đổi có thể tách rời và đảo ngược, cho phép dữ liệu mini-batch được hậu xử lý độc lập, và đầu ra được đảo ngược về một bước tiền xử lý trước đó dựa trên siêu dữ liệu được theo dõi và các hoạt động đã áp dụng. Tính năng này đặc biệt có giá trị cho các phép tăng cường thời gian kiểm tra và hiểu các dự đoán của mô hình.
Phát triển và đào tạo mô hình mạnh mẽ
MONAI triển khai các mạng tham chiếu như UNet, DynUNet, DenseNet, GAN, AHNet, VNet, SENet, SegResNet và UNETR, được thiết kế để tương thích với đầu vào không gian 1D, 2D và 3D. Nó cũng cung cấp quyền truy cập vào các trọng số được đào tạo trước từ các nguồn như MMAR hoặc MONAI Model Zoo, bao gồm VISTA-3D, một mô hình nền tảng phân đoạn 3D hàng đầu.
Khác với các triển khai PyTorch tổng quát, MONAI bao gồm các hàm mất mát tập trung vào hình ảnh y tế như DiceLoss, GeneralizedDiceLoss, TverskyLoss (để kiểm soát sự đánh đổi giữa dương tính/âm tính giả), và DiceFocalLoss (kết hợp xử lý mất cân bằng lớp và khai thác ví dụ khó). Nó cũng cung cấp các tiện ích tối ưu hóa số học như Novograd và LearningRateFinder.
MONAI cung cấp các tăng tốc dựa trên GPU để đảm bảo sử dụng tối ưu các tài nguyên phần cứng cơ bản. Nó hỗ trợ đào tạo Auto Mixed Precision (AMP), tận dụng phần cứng của NVIDIA để giảm mức sử dụng bộ nhớ và tăng tốc đào tạo với sự thỏa hiệp về độ chính xác tối thiểu. Đào tạo song song dữ liệu phân tán được hỗ trợ cho nhiều thiết bị GPU trên một hoặc nhiều nút, với các bản demo cho PyTorch DDP, Horovod và Ignite DDP. Để tối đa hóa hiệu suất trong các bước quan trọng, MONAI tích hợp các tiện ích mở rộng C++/CUDA cho các quy trình chuyên biệt theo miền như Resampling, Conditional Random Field (CRF) và Fast bilateral filtering. Bộ nhớ đệm thông minh (ví dụ: CacheDataset
, PersistentDataset
, SmartCacheDataset
) được triển khai để tăng tốc đọc và tiền xử lý dữ liệu, điều này rất quan trọng đối với các phương pháp dựa trên dữ liệu yêu cầu nhiều epoch đào tạo. ThreadDataLoader
tiếp tục cải thiện việc sử dụng GPU bằng cách thực hiện các phép biến đổi trong một luồng riêng biệt.
Khả năng tái tạo có thể đạt được với các kiểm soát cục bộ ở mức độ chi tiết thông qua API Randomizable
và trên toàn cầu bằng cách sử dụng set_determinism
. MONAI Bundles cũng thúc đẩy khả năng tái tạo bằng cách đóng gói các mô hình với tất cả thông tin cần thiết và cấu hình có cấu trúc.
Các tài liệu nghiên cứu liên tục nhấn mạnh các phép biến đổi “chuyên biệt theo miền”, các hàm mất mát, các số liệu đánh giá và các kiến trúc mạng. Điều này cho thấy rằng MONAI không chỉ đơn thuần áp dụng các phương pháp học sâu tổng quát cho dữ liệu y tế mà còn tích hợp sâu sắc sự hiểu biết về các đặc điểm hình ảnh y tế (ví dụ: 2D/3D/4D, các định dạng phức tạp như DICOM/NIfTI, các đặc điểm giải phẫu cụ thể, sự mất cân bằng lớp vốn có trong các bệnh lý). Việc bao gồm MetaTensor
để bảo toàn siêu dữ liệu càng củng cố sự chuyên biệt này. Sự chuyên biệt sâu sắc này có nghĩa là MONAI không chỉ là một khung học sâu tổng quát được điều chỉnh cho dữ liệu y tế, mà là một khung nền vốn hiểu và tối ưu hóa cho các sắc thái và thách thức độc đáo của hình ảnh y tế. Điều này dẫn đến việc phát triển các mô hình AI chính xác hơn, mạnh mẽ hơn và liên quan đến lâm sàng hơn, vì nó trực tiếp giải quyết các vấn đề như voxel không đẳng hướng, phạm vi cường độ đa dạng và nhu cầu về các số liệu phân đoạn có độ trung thực cao (ví dụ: Dice, Hausdorff) rất quan trọng cho việc xác nhận lâm sàng. Nó giảm đáng kể nỗ lực cần thiết cho các nhà nghiên cứu để điều chỉnh các phương pháp học sâu tổng quát cho các ngữ cảnh y tế phức tạp, tăng tốc phát triển và cải thiện chất lượng mô hình.
Bảng 2: Các tính năng tối ưu hóa hiệu suất của MONAI
Tính năng | Mô tả | Lợi ích/Tác động đến đào tạo | Mô-đun/API MONAI liên quan |
Auto Mixed Precision (AMP) | Kết hợp tính toán độ chính xác đơn (FP32) với độ chính xác bán (FP16) trong quá trình đào tạo mạng. | Giảm mức sử dụng bộ nhớ và tăng tốc độ đào tạo với sự thỏa hiệp về độ chính xác tối thiểu. | SupervisedTrainer , SupervisedEvaluator |
Đào tạo phân tán (Distributed Training) | Kết nối nhiều thiết bị GPU trên một hoặc nhiều nút để đào tạo hoặc đánh giá mô hình. | Tăng tốc đáng kể quá trình đào tạo cho các tập dữ liệu lớn và mô hình phức tạp; cải thiện khả năng mở rộng. | PyTorch DDP, Horovod, Ignite DDP |
Mô-đun tối ưu hóa C++/CUDA | Triển khai các hoạt động chuyên biệt theo miền trong C++/CUDA để tăng tốc tính toán nặng. | Mang lại hiệu suất nhanh hơn đáng kể (đôi khi gấp hàng trăm lần) cho các tác vụ như Resampling, CRF, Fast bilateral filtering. | Resampler , Conditional random field (CRF) , Fast bilateral filtering , Gaussian mixtures |
Bộ nhớ đệm thông minh (Smart Caching) | Bộ dữ liệu dựa trên bộ nhớ đệm đa luồng để tăng tốc đọc và tiền xử lý dữ liệu. | Giảm thời gian tải dữ liệu và tiền xử lý, đặc biệt quan trọng đối với các tập dữ liệu lớn và nhiều epoch đào tạo. Bộ nhớ đệm có thể tồn tại và động. | CacheDataset , PersistentDataset , SmartCacheDataset |
Biến đổi dựa trên GPU (GPU-based Transforms) | Thực hiện các phép biến đổi tiền xử lý trực tiếp trên GPU. | Giảm thiểu việc chuyển dữ liệu giữa CPU và GPU, tối ưu hóa việc sử dụng tài nguyên phần cứng và tăng tốc quy trình. | monai.transforms |
ThreadDataLoader | Thực hiện các phép biến đổi trong một luồng riêng biệt. | Ngăn chặn thời gian IPC không cần thiết và cải thiện việc sử dụng GPU, đặc biệt cho các phép biến đổi nhẹ khi dữ liệu được lưu vào RAM. | ThreadDataLoader |
Đánh giá và suy luận toàn diện
MONAI Core cung cấp một bộ số liệu đánh giá toàn diện được thiết kế riêng để đánh giá hiệu suất của các mô hình hình ảnh y tế, bao gồm Dice trung bình, đường cong đặc trưng hoạt động của bộ thu (ROCAUC), ma trận nhầm lẫn, khoảng cách Hausdorff, khoảng cách bề mặt và độ nhạy tắc nghẽn. Các API này cũng hỗ trợ tính toán đa xử lý để tăng hiệu quả.
MONAI cung cấp suy luận cửa sổ trượt, một phương pháp phổ biến và hiệu quả về bộ nhớ để suy luận mô hình hiệu suất cao trên các khối lượng lớn. Nó hỗ trợ cấu hình overlap
và blending_mode
cho các cửa sổ chồng chéo, đảm bảo các dự đoán mạnh mẽ và chính xác trên các hình ảnh y tế 3D/4D lớn.
Ngoài việc vẽ biểu đồ thông thường, MONAI tích hợp với TensorBoard và MLFlow để trực quan hóa đầu vào thể tích dưới dạng ảnh GIF động, bản đồ phân đoạn và bản đồ tính năng trung gian. Nó cũng cung cấp matshow3d
để trực quan hóa hình ảnh 3D dưới dạng khung 2D và blend_images
để trộn dữ liệu hình ảnh và nhãn để trực quan hóa phân đoạn. Hơn nữa, các API Class Activation Mapping (CAM), GradCAM và GradCAM++ có sẵn để trực quan hóa bản đồ kích hoạt lớp trong các mô hình phân loại được đào tạo, hỗ trợ khả năng giải thích mô hình.
Trong lĩnh vực AI y tế được quản lý chặt chẽ và có rủi ro cao, sự tin cậy và xác nhận nghiêm ngặt là tối quan trọng. MONAI hỗ trợ rõ ràng “tính xác định và khả năng tái tạo”, và MONAI Bundles được thiết kế để đảm bảo “khả năng tái tạo và dễ sử dụng”. Hơn nữa, khung nền này cung cấp “các công cụ trực quan hóa để hiểu rõ dữ liệu và giải thích mô hình”, bao gồm các kỹ thuật tiên tiến như CAM/GradCAM và độ nhạy tắc nghẽn. Khả năng tái tạo đảm bảo rằng các phát hiện nghiên cứu có thể được xác minh và xây dựng một cách nhất quán, điều này rất cần thiết cho việc phê duyệt theo quy định, áp dụng lâm sàng và tính toàn vẹn khoa học. Các công cụ giải thích, chẳng hạn như Bản đồ kích hoạt lớp, rất quan trọng để các bác sĩ lâm sàng hiểu tại sao một mô hình AI lại đưa ra một dự đoán nhất định, thúc đẩy sự tin cậy và cho phép đưa ra quyết định tốt hơn, có thông tin hơn, đặc biệt trong các kịch bản chẩn đoán và điều trị quan trọng. Sự tập trung mạnh mẽ vào các kết quả AI có thể xác minh và dễ hiểu này định vị MONAI là một khung nền được xây dựng với các nguyên tắc cốt lõi là chuyển đổi lâm sàng và phát triển AI có trách nhiệm, vượt xa các số liệu hiệu suất thô.
Các mô hình và quy trình làm việc AI tiên tiến
Auto3dseg là một giải pháp toàn diện cho phân đoạn hình ảnh y tế 3D quy mô lớn, được thiết kế cho cả người dùng mới và chuyên gia. Nó tự động hóa phân tích tập dữ liệu (cường độ, kích thước, khoảng cách), tạo thuật toán (cấu hình thư mục dựa trên đánh giá dữ liệu), đào tạo mô hình với tối ưu hóa GPU và tập hợp mô hình để tăng cường độ chính xác và độ tin cậy.
MONAI hỗ trợ tập hợp dựa trên xác thực chéo với EnsembleEvaluator
để tăng cường tính mạnh mẽ và khả năng khái quát hóa của mô hình. Nó cung cấp các ví dụ về học liên bang (FL) với các khung như NVFlare, OpenFL và Substra, cho phép đào tạo các mô hình trên các tập dữ liệu phân tán trong khi vẫn bảo vệ quyền riêng tư dữ liệu bệnh nhân. Các quy trình học tự giám sát (SSL) cũng được hỗ trợ, cho phép đào tạo trước các mô hình trên lượng lớn dữ liệu y tế không được gắn nhãn và sau đó tinh chỉnh chúng cho các tác vụ cụ thể.
MONAI bao gồm các khả năng cho mạng đối kháng tạo sinh (GAN) để tạo hình ảnh. Model Zoo có các mô hình như GAN để tổng hợp hình ảnh X-quang tay và MAISI, một mô hình dựa trên khuếch tán để tạo hình ảnh CT 3D tổng hợp với kiểm soát giải phẫu. Các mô hình khuếch tán cũng được sử dụng để tổng hợp hình ảnh và thậm chí cho các tập hợp phân đoạn hình ảnh ngầm định. Khả năng này có giá trị cao cho việc tăng cường dữ liệu và tạo ra các tập dữ liệu đào tạo đa dạng, đặc biệt khi dữ liệu được chú thích thực tế khan hiếm.
Việc bao gồm rõ ràng các khả năng Học liên bang, Học tự giám sát và Mô hình tạo sinh trong MONAI trực tiếp giải quyết hai trong số những trở ngại thực tế đáng kể nhất trong AI y tế: các mối lo ngại về quyền riêng tư dữ liệu và sự khan hiếm của các tập dữ liệu lớn, được chú thích. Học liên bang cho phép đào tạo trên dữ liệu bệnh nhân nhạy cảm, phi tập trung mà không cần tập trung hóa, do đó bảo vệ quyền riêng tư. Học tự giám sát và các mô hình tạo sinh có thể tận dụng lượng lớn dữ liệu không được gắn nhãn hoặc tổng hợp dữ liệu mới, thực tế để tăng cường các tập dữ liệu được chú thích hạn chế, giảm thiểu chi phí và công sức cao của việc chú thích thủ công. Các mô hình học tiên tiến này không chỉ là các tính năng “bổ sung” mà là các giải pháp cơ bản cho các hạn chế thực tế trong hình ảnh y tế. Học liên bang cho phép nghiên cứu hợp tác giữa nhiều tổ chức trong khi tuân thủ các quy định nghiêm ngặt về quyền riêng tư, tăng tốc nghiên cứu trên các nhóm bệnh nhân đa dạng. Học tự giám sát và các mô hình tạo sinh giảm đáng kể sự phụ thuộc vào việc chú thích thủ công tốn nhiều công sức, làm cho việc phát triển AI có thể mở rộng và dễ tiếp cận hơn. Điều này chứng tỏ cách tiếp cận tư duy tiến bộ của MONAI để vượt qua các rào cản thực tế, làm cho việc phát triển AI hiệu quả hơn và đạo đức hơn trong chăm sóc sức khỏe.
Ứng dụng thực tế và tác động trong thế giới thực trong hình ảnh y tế
Các tác vụ hình ảnh y tế cốt lõi
MONAI được sử dụng rộng rãi cho phân đoạn hình ảnh. Các ví dụ bao gồm phân đoạn 3D khối u não, các cơ quan bụng, tuyến tụy và khối u tuyến tụy, lá lách, và phân đoạn đa cơ quan. Trong bệnh lý học, nó hỗ trợ phát hiện tế bào và phân loại mô, bao gồm phát hiện mô di căn trong hình ảnh toàn bộ tiêu bản. Đối với nội soi, nó được tối ưu hóa để phát hiện polyp và theo dõi công cụ phẫu thuật trong chuỗi video. VISTA-3D, một mô hình nền tảng trong MONAI, cung cấp hiệu suất chính xác ngay lập tức để phân đoạn hơn 120 lớp cơ quan chính trong hình ảnh CT.
MONAI hỗ trợ các tác vụ phân loại hình ảnh. Các ví dụ bao gồm phân loại hình ảnh 2D với tập dữ liệu MedNIST và phân loại tự động mật độ mô vú trong ảnh chụp X-quang tuyến vú theo các danh mục BI-RADS.
MONAI tạo điều kiện cho đăng ký hình ảnh, với các hướng dẫn trình bày đăng ký 3D các thể tích CT phổi ghép đôi và các thể tích MRI não không ghép đôi bằng cách sử dụng các khung như VoxelMorph. Nó cũng hỗ trợ đào tạo các mô hình đăng ký và phân đoạn cùng nhau (DeepAtlas), điều này hữu ích cho các kịch bản có nhiều hình ảnh không được gắn nhãn và ít hình ảnh được phân đoạn.
MONAI hỗ trợ tạo hình ảnh. Model Zoo bao gồm các mạng đối kháng tạo sinh (GAN) để tổng hợp hình ảnh X-quang tay và MAISI, một mô hình dựa trên khuếch tán để tạo hình ảnh CT 3D tổng hợp với kiểm soát giải phẫu. Các mô hình khuếch tán cũng được sử dụng để tổng hợp hình ảnh và thậm chí cho các tập hợp phân đoạn hình ảnh ngầm định. Khả năng này có giá trị cao cho việc tăng cường dữ liệu và tạo ra các tập dữ liệu đào tạo đa dạng.
Tích hợp và triển khai lâm sàng
MONAI Label được thiết kế đặc biệt cho chú thích được hỗ trợ bởi AI, cho phép chú thích nhanh hơn, chính xác hơn và nhất quán hơn bằng cách kết hợp sự hỗ trợ của AI với chuyên môn lâm sàng. Nó cung cấp các mô hình AI tương tác, học tích cực để cải thiện liên tục và hỗ trợ AI thời gian thực trên các miền này.
MONAI Label tích hợp với các nền tảng hình ảnh y tế phổ biến như 3D Slicer, trình xem OHIF, MITK, QuPath và Digital Slide Archive. Quan trọng hơn, MONAI Deploy đã được Siemens Healthineers áp dụng cho các nền tảng hình ảnh doanh nghiệp Syngo Carbon và syngo.via của họ, tăng tốc đáng kể việc tích hợp các quy trình làm việc AI vào các cài đặt lâm sàng trong thế giới thực. Điều này cho phép hàng nghìn nhà nghiên cứu lâm sàng trực tiếp tiếp cận các tiến bộ do AI điều khiển.
Các khả năng đầu cuối của MONAI, từ đổi mới nghiên cứu đến ứng dụng lâm sàng, được nhấn mạnh bởi vai trò của nó trong việc tăng tốc triển khai mô hình AI. Khả năng chuyển các mô hình AI đã đào tạo vào các cài đặt lâm sàng chỉ với “vài cú nhấp chuột” là một bước nhảy vọt lớn, giúp các nhà nghiên cứu và công ty khởi nghiệp đưa ứng dụng của họ đến tay các bác sĩ X-quang nhanh hơn. Điều này trực tiếp trao quyền cho các tổ chức chăm sóc sức khỏe để khai thác và hưởng lợi từ những tiến bộ mới nhất trong hình ảnh y tế dựa trên AI nhanh hơn bao giờ hết.
MONAI Label liên tục được nhấn mạnh là một “công cụ chú thích và học tập hình ảnh thông minh” giúp “nâng cao quy trình chú thích và học tập hình ảnh bằng cách kết hợp sự hỗ trợ của AI”. Mục tiêu rõ ràng của nó là “giảm thời gian và công sức cần thiết để chú thích các tập dữ liệu mới”. Điều này cho thấy rằng dự án MONAI nhận ra chú thích dữ liệu là một nút thắt cổ chai quan trọng, thường tốn nhiều công sức và chi phí, trong việc phát triển AI y tế chất lượng cao. Bằng cách cung cấp các công cụ chú thích mạnh mẽ được hỗ trợ bởi AI, MONAI trực tiếp giải quyết một thách thức cơ bản đối với AI y tế. Các tập dữ liệu được chú thích chất lượng cao, chính xác là không thể thiếu để đào tạo các mô hình học sâu hiệu quả. Tự động hóa và tăng tốc quy trình này không chỉ là một sự tiện lợi; nó là một điều kiện tiên quyết để mở rộng quy mô nghiên cứu và phát triển AI y tế. Tính năng này làm giảm đáng kể rào cản gia nhập để tạo ra các tập dữ liệu lớn, đa dạng và có liên quan đến lâm sàng, do đó tăng tốc toàn bộ quy trình AI và làm cho các dự án phức tạp, đòi hỏi nhiều dữ liệu trở nên khả thi và hiệu quả hơn.
Việc Siemens Healthineers, một công ty công nghệ y tế lớn, áp dụng MONAI Deploy là một chi tiết rất quan trọng. Đây không chỉ là một khung lý thuyết; nó đang được sử dụng tích cực để tích hợp AI vào các nền tảng lâm sàng được cài đặt rộng rãi của họ (hơn 15.000 cài đặt). Sự hợp tác này chứng tỏ một con đường rõ ràng và thành công từ nghiên cứu học thuật đến tiện ích lâm sàng thực tế, tăng tốc đáng kể việc tích hợp AI từ “nhiều tháng” xuống “vài cú nhấp chuột”. Sự hợp tác công nghiệp nổi bật này đóng vai trò là một sự xác nhận mạnh mẽ về thiết kế và khả năng của MONAI để triển khai lâm sàng trong thế giới thực. Nó biểu thị rằng MONAI không chỉ là một công cụ để khám phá học thuật mà còn là một giải pháp mạnh mẽ, đáng tin cậy và có thể mở rộng được các nhà lãnh đạo trong ngành tin cậy. Những sự hợp tác như vậy rất quan trọng đối với việc áp dụng rộng rãi AI y tế, vì chúng đảm bảo rằng các mô hình AI có thể được tích hợp liền mạch vào các quy trình làm việc lâm sàng hiện có, cuối cùng dẫn đến những cải tiến hữu hình trong chăm sóc bệnh nhân, hiệu quả chẩn đoán và hiệu quả hoạt động. Nó cũng cho thấy rằng MONAI được thiết kế với các ràng buộc lâm sàng thực tế và các cân nhắc quy định trong tâm trí.