بهبود زندگی بیماران سرطانی با شناسایی داروهای عمومی غیر سرطانی موجود

بهبود زندگی بیماران سرطانی با شناسایی داروهای عمومی غیر سرطانی موجود

درخواست کن

چالش کامل شد! نتایج به زودی دنبال می شوند

Reboot Rx استارتاپ غیرانتفاعی فناوری است که به ردیابی سریع توسعه درمان های سرطان با قیمت مناسب اختصاص دارد. استراتژی آنها از داروهای عمومی ، فن آوری AI و مدل های نوین بودجه استفاده مجدد می کند. 50 تغییر دهنده فناوری در حال توسعه روشهای خودکار استخراج و ذخیره تعداد بیماران و مطالعه نتایج متن غیر ساختاری در مطالعات بالینی منتشر شده هستند.

مشکل

راه اندازی مجدد Rx در حال حل یک مشکل بزرگ است. هر ساله در سراسر جهان ، 17 میلیون نفر مبتلا به سرطان تشخیص داده می شوند ، 10 میلیون نفر بر اثر سرطان می میرند و 1 تریلیون دلار نیز برای مراقبت از سرطان هزینه می شود.

اهداف پروژه

مطالعات بالینی ، مانند آزمایشات بالینی و مطالعات مشاهده ای ، ارزیابی می کنند که آیا یک مداخله دارویی برای درمان بیماری موثر است. بسیاری از مطالعات بالینی داروهای عمومی غیر سرطانی را برای درمان سرطان ارزیابی کرده اند. راه اندازی مجدد Rx علاقه مند به تولید اطلاعات از انتشاراتی است که این مطالعات را توصیف می کنند تا امیدوار کننده ترین فرصت های استفاده مجدد را شناسایی کند.

انتشارات مطالعات بالینی مقادیر عددی ، از جمله شمارش بیمار (که به عنوان “اندازه نمونه” ذکر می شود) و نتایج مطالعه (که به عنوان “اقدامات نتیجه” ذکر می شود) ، در قالب متن روایی بدون ساختار گزارش می شود. هدف این پروژه استخراج خودکار این مقادیر و ذخیره آنها در قالب ساختاری برای تجزیه و تحلیل است.

به عنوان مثال ، جمله “میزان پاسخ کلی به ترتیب با متفورمین و پرواستاتین 45٪ و 30٪ بود” پاسخ دو دارو متفورمین و پرواستاتین را در جمعیت بیمار گزارش می کند. راه اندازی مجدد Rx می خواهد معیارهای عددی نتیجه (45٪ و 30٪) را از متن استخراج کرده و این مقادیر را با برچسب نتیجه (‘نرخ پاسخ’) برچسب گذاری کند. سطح دشواری این کار بسته به نوع و دامنه مطالعه بالینی می تواند از آسان تا بسیار چالش برانگیز باشد. مطالعات بالینی که گزارش یک نتیجه واحد را با ارزیابی دو گروه درمانی دارند ، به راحتی قابل کنترل است.

از طرف دیگر ، آزمایشات بالینی با چندین گروه مقایسه (سه یا چند بازوی دارویی به طور همزمان ارزیابی می شود) یا مطالعات با ترکیبات دارویی (هر بازوی مداخله حاوی دو یا چند دارو) می تواند پیچیدگی کار را ایجاد کند.

تکنیک های فعلی NLP و مدل های زبان کار معقولی را انجام می دهند که مقادیر عددی را استخراج می کنند. اما این روش ها برای کار خاصی که در بالا پیشنهاد شده متناسب نیستند. برای برچسب گذاری مقادیر استخراج شده با دقت بالایی ، شرکت کنندگان باید تکنیک های مدل سازی شده تحت نظارت و نیمه نظارت شده را با استفاده از روش های منحصر به فرد مبتنی بر قوانین و / یا تدوین مجموعه داده های آموزشی داده های دارای برچسب ، ارتقا دهند.

راه اندازی مجدد Rx سوالات مربوط به حوزه خاص مربوط به زبان و اصطلاحات مورد استفاده در مطالعات را روشن می کند. راه اندازی مجدد Rx همچنین داده های آموزش دارای برچسب دستی را بررسی و بازخورد می دهد.

نتایج پروژه

این یک تمرین استخراج و طبقه بندی خودکار داده برای ایجاد یک پایگاه داده ساختاریافته ، در مقیاس ، از نتایج نتیجه موجود در خلاصه مقاله مطالعه بالینی است. استخراج داده ها محدود به متن موجود در چکیده مقاله (استفاده نکردن از متن کامل مطالعه) خواهد بود. Reboot Rx لیستی از مطالعات بالینی همراه با شناسه ، عنوان و چکیده مطالعه را ارائه می دهد.

برای محدود کردن دامنه این تمرین ، راه اندازی مجدد Rx لیستی از اقدامات نتیجه ، برچسب های نتیجه و قالب داده مورد انتظار (٪ ، ماه ، روز) را برای استخراج ارائه می دهد. صحت داده ها و برچسب های استخراج شده با استفاده از مجموعه داده های آزمایشی که توسط تیم Reboot Rx تنظیم شده است ، ارزیابی می شود.

نتایج نمایندگی پروژه به شرح زیر است:

  • مدل (های) یادگیری ماشین و / یا قوانین استخراج اطلاعات برای استخراج داده های عددی از خلاصه مقاله مطالعات بالینی و طبقه بندی آنها با برچسب های نتایج مشخص شده
  • کد آموزش و ارزیابی مدل
  • مجموعه داده های آموزشی با برچسب های تنظیم شده برای آموزش مدل استفاده می شود
  • کد برای توابع بسته بندی مورد نیاز برای استخراج و ذخیره داده ها در یک قالب ساختاری
  • جداول داده یا پایگاه داده با مقادیر استخراج شده از لیست مشخص از خلاصه مطالعه ها

این چالش میزبان دوستان ماست در