Главная страница
Навигация по странице:

  • Кіріспе Деректер түрлері

  • Жиілікті бөлу

  • Гистограммалар және басқа жиілік графиктері

  • Жиілікті бөлу формалары

  • Реферат нурымбет шугыла. Реферат Таырыбы Биомедициналы мліметтерді графикалы крсетілімі. Жиілік лестірімдерін крсету Орындаан Нрымбет Шыла

    Единственный в мире Музей Смайликов

    Самая яркая достопримечательность Крыма

    Скачать 0.85 Mb.
    НазваниеРеферат Таырыбы Биомедициналы мліметтерді графикалы крсетілімі. Жиілік лестірімдерін крсету Орындаан Нрымбет Шыла
    Дата18.04.2022
    Размер0.85 Mb.
    Формат файлаdocx
    Имя файлаРеферат нурымбет шугыла.docx
    ТипРеферат
    #482221

    С этим файлом связано 6 файл(ов). Среди них: 1147.pdf, СОДЕРЖАНИЕ.docx, 13. Казахстан - государство, признанное современным миром.ppt, Әлеуметтану дифф.docx, саясаттану дифф сынак.docx, Кейс- 2 СД.pptx.
    Показать все связанные файлы
    Подборка по базе: Админ право Ч2 Военная служба РЕФЕРАТ.docx, методы управления затратами реферат.pdf, заключение реферат.docx, Физическая культура реферат.doc, метрология Реферат готово.docx, Хрущев Реферат.docx, История реферат.docx, Безопасность жизнедеятельности Реферат.docx, Правоведение реферат.docx, ПРИКЛАДНАЯ ФИЗРА И СПОРТ РЕФЕРАТ.docx

    «Астана медицина университеті»

    Биостатистика, биоинформатика және ақпараттық технологиялар кафедрасы

    Реферат

    Тақырыбы: Биомедициналық мәліметтердің графикалық көрсетілімі. Жиілік үлестірімдерін көрсету

    Орындаған:Нұрымбет Шұғыла

    Нұр Сұлтан қаласы

    2022 жыл

    Жоспар

    • Кіріспе

    • Деректер түрлері

    • Жиілікті бөлу

    • Гистограммалар және басқа жиілік графиктері

    • Жиілікті бөлу формалары

    • Негізгі бөлім

    • Деректерді визуализациялау, SciVis және InfoVis

    • Қорытынды

    • Қолданылған әдебиеттер



    Кіріспе

    Деректер түрлері

    Статистикада біз "айнымалы" терминін үлгінің немесе популяцияның бір мүшесіне екіншісіне өзгеретін сапаға немесе санға сілтеме жасау үшін қолданамыз. Систолалық қан қысымы-бұл адамнан адамға да, өлшеуден сол адамның ішіндегі өлшеуге дейін өзгеретін айнымалы мән. Жыныс-өзгермелі шама, адамдар еркек немесе әйел бола алады.Деректерді бірнеше түрлі типтер ретінде қарастырған пайдалы, өйткені ұсыну мен талдаудың қандай әдістерін қолдану керектігі туралы шешім қабылдаған кезде деректер түрі маңызды. Біз жасаған алғашқы жіктеу-бұл сандық және сандық мәліметтер.Сапалық деректер адамдарды диагноз немесе жыныс сияқты жеке сыныптарға бөлуге болатын кезде пайда болады. Сапалық айнымалы категориялық айнымалы немесе классификациялық айнымалы деп те аталады.Сандық деректер санау немесе өлшеу нәтижесінде алынған сандық болып табылады. Жараның ауданы сандық айнымалы болып табылады, сонымен қатар жараны емдеуге дейінгі уақыт ұзақтығы және қатынасы, болашақ ананың алдыңғы жүктіліктерінің саны. Егер өлшеу мәндері бірнеше бөлек мәндерді қабылдай алса, көбінесе бүтін сандар (бүтін сандар), Паритет сияқты, бұл деректер дискретті болып саналады. Егер өлшеу мәндері жараның ауданы, бойы немесе салмағы сияқты кез-келген санды қабылдай алса, деректер үздіксіз болып саналады. Іс жүзінде, әрине, биіктік сияқты өлшемдер шкаладан оқылған кезде белгілі бір дәлдікпен жасалады. Мысалы, биіктікті ең жақын сантиметрге дейін жазуға болады, сондықтан көптеген мүмкін мәндер болса да, тек соңғы санды жазуға болады, ал биіктік дискретті түрде жазылады. Алайда, егер негізгі айнымалы үздіксіз болса, біз әдетте практикалық өлшемдермен қойылған шектеулерді елемей, өлшеуді үздіксіз деп санаймыз.

    Жиілікті бөлу

    1-кестеде төменгі арқадағы ауырсынуды емдеу бойынша ұсыныстармен салыстырғанда физиотерапияның рандомизацияланған бақыланатын зерттеуі үшін алынған пациенттерді бағыттау көзі көрсетілген (Frost et al., 2004).

    Пациенттерді физиотерапиялық зерттеуге жіберу



    Бағыт көзі-сапалы айнымалы. Белгілі бір сапаға ие адамдардың саны іріктемедегі осы САПАНЫҢ жиілігі деп аталады. Осы қасиетке ие адамдардың үлесі салыстырмалы жиілік немесе пропорционалды жиілік деп аталады. Осылайша, жалпы тәжірибелік дәрігерге барудың салыстырмалы жиілігі 256/285 = 0,898 немесе 89,8% құрайды. Барлық мүмкін категориялардың жиілік жиынтығы айнымалы жиілікті бөлу деп аталады.

    2-кестеде Venus I зерттеуіне қатысу үшін терілген аяқтарындағы веноздық жаралары бар пациенттердің қозғалғыштығы көрсетілген (Нельсон және басқалар, 2004).



    Бұл айнымалы үшін Санаттар реттелген. Еркін жүретіндер қиын жүретіндерге қарағанда мобильді екендігі түсінікті, бұл өз кезегінде мүлдем жүре алмайтындарға қарағанда мобильді. Бұл 1-кестеде көрсетілген бағыт көзіне қатысты емес, мұнда жалғыз тәртіп ең жоғары жиіліктен ең төменгі жиілікке дейінгі тәртіп болып табылады. Жалпы тәжірибелік дәрігер, кеңесші, сұрыптаушы, спорт орталығы бар басқа мағына жоқ. Бұл жиынтық жиіліктерді қолдана отырып, ұтқырлықты бөлуді басқаша қарастыруға мүмкіндік береді. Айнымалы мәні үшін жиынтық жиілік-бұл мәннен кіші немесе оған тең мәндері бар адамдар саны. Демек, "науқас қиындықпен жүреді" жиынтық жиілігі 380 құрайды, яғни 380 пән белгілі бір дәрежеде жүре алады. Шаманың салыстырмалы жиынтық жиілігі-бұл мәннен кіші немесе оған тең мәндері бар үлгілердегі адамдардың үлесі. Салыстырмалы жиынтық жиілігі 'науқас қиындықпен жүреді' 380/383 = 0,992 немесе 99,2% құрайды.

    3-кестеде дискретті сапа айнымалысы көрсетілген-Venus I зерттеуінде субъектілер кездескен веноздық ойық жара эпизодтарының саны.



    Бұл дискретті, өйткені біреудің эпизоды бар немесе жоқ, эпизодтың бір бөлігі бола алмайды. Сондықтан сан 0 болуы керек (бұл сынақ кезінде емделетін жара бірінші эпизод екенін білдіреді), 1, 2, 3 және т.б. біз жиіліктердің таралуын алу үшін әр мүмкін мән қанша рет кездесетінін есептей аламыз және салыстырмалы және жиынтық жиіліктерді бұрынғыдай таба аламыз. 4-кестеде инсультпен ауыратын науқастардың үлгісінде өлшенген қан сарысуындағы холестериннің үздіксіз сапалық өзгерісі көрсетілген (Маркус және т.б., 1995).



    Веноздық ойық жара эпизодтарының саны үшін біз сияқты жиіліктердің таралуын таба алмаймыз. Көптеген мәндер тек бір рет кездесетіндіктен, кездесулердің санын есептеу көмектеспейді. Бір 3,6, екі 3,8 с, бір 4,5, үш 4,7 с, Екі 4,8 с және т. б. бар, бірақ 3,9 с, 4,0 с немесе 4,1 с жоқ.

    Пайдалы жиілікті бөлу үшін сарысуы бар холестерин шкаласын сынып аралықтарына бөлу керек, мысалы, 3,0-ден 4,0-ге дейін, 4,0-ден 5,0-ге дейін және т.б. Содан кейін біз әр сабақ аралығында қан сарысуындағы холестерин деңгейі бар адамдардың санын есептейміз. Біз қан сарысуындағы холестериннің әр деңгейінің бір және тек бір интервалға түскенін қалаймыз, сондықтан сабақ аралықтары бір-біріне сәйкес келмеуі керек.Екі рет санамас үшін шекаралық нүктенің қай аралықты қамтитынын шешуіміз керек. Әдетте аралықтың төменгі шекарасы осы аралыққа, ал жоғарғы шегі келесі аралыққа орналастырылады. Біз мұны істеуге міндеттіміз, бірақ бұл ыңғайлы келісім және егер оны жасамауға өте жақсы себеп болмаса, оны сақтау керек. Осылайша, 3.0-ден басталып, 4.0-ге дейінгі аралықта 3.0 болады, бірақ 4.0 емес. Біз оны "3.0 —" немесе "3.0 — 4.0 -" деп жаза аламыз, минус белгісі 4.0 — ге дейін, бірақ 4.0-ді қоспағанда немесе "3.0-3.999'.

    5-кесте 1,0 ммоль/л интервал өлшемін қолданып, 3,0-ден бастасақ, біз алатын жиіліктердің таралуын көрсетеді.

    Компьютерлер оңай қол жетімді болмай тұрып, адамдарға бес адамнан тұратын топтарды санап, әр бақылауды дұрыс аралықта белгілеу үшін санау жүйесін қолдана отырып үйретілді. 5-кестеде жиіліктердің таралуын есептеудің көрінісі көрсетілген және сіз оны статистика кітаптарында жиі көресіз. Мұны дәл жасау өте қиын, сондықтан кедей зерттеуші бірдей жиіліктер екі рет алынғанға дейін оны қайталай береді. Мен мұны компьютермен жасадым және кез-келген зерттеушіге дәл солай жасауды ұсынар едім; біздің бағалауымыз тек кене үшін.

    5-кестеде көрсетілген жиіліктер жиіліктердің бір ғана мүмкін таралуы болып табылады. Ені 1,0 аралықты таңдау еркін және 6-кестеде тар аралықты қолдана отырып алынған жиіліктердің таралуы көрсетілген.



    Жиіліктер әртүрлі. Біз де аралықтың басқа басталу нүктесін таңдай аламыз. Бізде 3,45-тен басталатын интервалдар болуы мүмкін, ені 0,92, егер қаласаңыз, таңдау ыңғайлы болу үшін жасалады, өйткені бір дұрыс интервалдар жиынтығы бар. Үздіксіз деректер үшін жеке жиіліктер маңызды емес. Бұл бөлу, ақпаратты тасымалдайтын барлық жиіліктердің жиынтығы.

    Көптеген адамдарға 5 және 6 кестелерде көрсетілгенге ұқсас жиілік бағанынан көптеген пайдалы ақпарат алу өте қиын болғандықтан, біз оларды әдетте сандар ретінде емес, келесі бөлімде сипатталған гистограмма сияқты сурет ретінде қарастырамыз.

    Гистограммалар және басқа жиілік графиктері

    Гистограмма-бұл жиіліктердің таралуын көрсететін график. 1-суретте 5-кесте үшін гистограмма көрсетілген.

    Сурет 1. Сарысу холестеринінің гистограммасы, жиілік шкаласы

    Айнымалы, қан сарысуындағы холестерин деңгейі көлденең осьте, ал жиілігі тік осьте көрсетілген. Әр интервалдың үстінде тікбұрышты жолақ бар, оның биіктігі жиілікті, осы аралыққа түсетін бақылаулар санын білдіреді.

    2-суретте сол мәліметтер үшін басқа гистограмма көрсетілген.

    Сурет 2. Бастапқы нүктесі 3,25 ммоль/л және интервалы 0,5 ммоль/л пайдаланылатын Сарысу холестеринінің гистограммасы, жиілік шкаласы

    Интервалдың ені 6-кестедегідей 0,5 ммоль/л құрайды, бірақ мен бастапқы нүктені 3,0-ден 3,25-ке дейін өзгерттім. Жиіліктер әр түрлі болғанымен, екі гистограмманың формалары ұқсас. Екеуі де төмен холестерин деңгейлері үшін төмен жиіліктерге ие, ось бойымен жоғары жиіліктер, максимум 5-тен 6-ға дейін жетеді, содан кейін холестерин деңгейі жоғарылаған сайын төмендейді, 11 ммоль /л-ден жоғары бақыланбайды. Алайда, 1-сурет 2-суретке қарағанда біркелкі емес, ол салыстырмалы түрде біркелкі емес. Бұл интервалдар кішірек болғандықтан, олардағы жиіліктер аз болғандықтан, оларды кездейсоқ тербелістерге бейім етеді. Әдетте біз бөлу формасын неғұрлым айқын ететін интервал мөлшерін таңдауға тырысамыз. Бізге тік ось бойынша жиілік графигін салудың қажеті жоқ, ал 3-суретте оның орнына 1-суретте тік ось бойынша салыстырмалы жиілікпен бөлу көрсетілген.

    Сурет 3. Сарысу холестеринінің гистограммасы, салыстырмалы жиілік шкаласы

    Шкала олардың санын емес, әр аралықтағы бақылаулардың үлесін көрсетеді. Бұл үлгіні гистограммаларды әртүрлі бақылаулармен салыстыруды жеңілдетеді.

    Гистограмманы құрудың тағы бір тәсілі - жиілік тығыздығын пайдалану. 4-суретте жиілік тығыздығы шкаласын қолдана отырып, 2-суретпен салыстырғанда жиіліктердің таралуы көрсетілген.

    4-сурет 2-суретті таратуға арналған сарысу холестеринінің гистограммасы, жиілік тығыздығы шкаласы

    Жиілікті интервалда көрсетудің орнына, біз қан сарысуындағы ммоль/л холестериннің жиілігін көрсетеміз. Басқаша айтқанда, біз бір айнымалыға бақылау санын көрсетеміз. Жиілік тығыздығы-бұл аралықтың еніне бөлінген жиілік. - Сур. 2 және сурет. 4 интервалдың ені 0,5, сондықтан жиілік тығыздығы жиілік мөлшерінен екі есе, ал тік масштаб бір суреттен тұрады. 4 тиісінше жоғары. Бұл интервалдың жиілігі жиіліктің тығыздығын интервалдың еніне көбейту арқылы анықталады дегенді білдіреді. Бұл қан сарысуындағы холестериннің екі мәні арасындағы жиілік осы мәндер арасындағы гистограмма астындағы аймақпен көрсетілгенін білдіреді. 3,75-тен 4,25 ммоль/л-ге дейінгі интервал үшін жиілік тығыздығы ммоль/л-ге 4 Бақылау құрайды, интервалдың ені 0,5 ммоль/л, сондықтан жиілік 4 × 0,5 = 2 құрайды, оны 4-кестеден растауға болады. Егер біз жиіліктің салыстырмалы тығыздығының графигін жасасақ, онда бір айнымалыға бақылау фракциялары, онда гистограмма астындағы жалпы аудан 1,0 болады.

    Жиілік тығыздығы туралы қандай мақаламен алаңдаймыз? Себебі, бұл бізге әртүрлі мөлшердегі аралықтарды алуға мүмкіндік береді. Мысалы, 5-суретте қалыпты сау адамдар тобының систолалық қан қысымының гистограммасы, 4-кестеде инсульт пациенттерін салыстырған бақылау тобы көрсетілген (Маркус және басқалар, 1995).

    Сурет 5. 92 сау бақылау топтарындағы систолалық қан қысымының гистограммасы, жиілік шкаласы (Markus мәліметтері және т. б., 1995)



    3-кестеде көрсетілген ойық жара эпизодтарының саны сияқты дискретті айнымалы үшін гистограмма салған кезде, біз өзімізге және оқырмандарымызға бұл шынымен дискретті айнымалы екенін және 2,3 эпизод сияқты аралық мәндер мағынасыз болатынын еске түсіру үшін әртүрлі мәндерді бөлуге болады.

    Жиілікті бөлу формалары

    Мен сандық айнымалы үшін бөлу формасы маңызды екенін айттым. Мұны сипаттау үшін бөлудің екі аспектісін бөліп көрсетеміз: режим және құйрықтар. Режим-бұл үлестірудегі ең көп таралған мән. 3-кестеден режим 375 тақырыптың 145-і үшін хабарланған бір эпизод екенін көруге болады.

    Үздіксіз деректер үшін режимді үлгі бойынша анықтау қиынырақ. 4-кестеге сәйкес холестериннің ең көп таралған деңгейі 5,6 құрайды, бірақ 86 пән үшін 7 бақылау жүргізілді. Модальды байқаудың орнына біз модальды сынып туралы ойлаймыз, ең көп бақылаулар болатын интервал. 1-сурет үшін бұл 5,0-ден 6,0-ге дейінгі интервал, оған 24 бақылау кіреді. Режим үлестірудің ортасында орналасқан, онда бақылаулар жиі кездеседі. Құйрықтар-бұл өте сирек кездесетін таралу нүктелері. 12-суретте режим, яғни модальды класс, сондай-ақ инсульт алған пациенттерде сарысулық холестеринді таратудың жоғарғы және төменгі құйрықтары көрсетілген.

    Сурет 12. Бөлу режимі және құйрықтары

    Суретте көрсетілген үлестірімдер. 1, сурет. 6 және сурет. 11, бір айқын режимге ие. Біз үлестіруді бір режиммен унимодальды деп атаймыз.

    Кейде бізде бірнеше режим бар дистрибуция бар. Мысалы, 13-суретте 6-суреттегі қалыпты пәндермен салыстырғанда мүлдем басқа популяциядан тест пәндерін іріктеу үшін систолалық қан қысымы көрсетілген.Сурет 13. Қарқынды терапия бөліміне түскен 251 науқаста систолалық қан қысымы (Фридланд соавт., 1996)

    Бұл реанимация бөліміне түскен науқастар болды (Фридланд және басқалар, 1996). Қалыпты пәннің үлгісінде 120-140 мм рт. ст. кезінде айқын модальды класс байқалды. 13-суретте 120-дан 140-қа дейінгі жиілік өте төмен, ал шыңы 100-ден 120-ға дейін. Алайда, 160 мен 180 арасында екінші, төменгі шың бар. Бұл жерде бізде өте ауыр науқастардың үлгісі бар, қарқынды терапияны қажет ететін науқастар жеткілікті, бірақ бұл қажеттілікке көптеген себептер бар. Шын мәнінде, осы 251 пациенттің арасында 77 түрлі диагностикалық категория болды. Кейбір жағдайларда олардың жағдайы қан қысымын нормадан төмендетеді, ал басқаларында оны нормадан жоғарылатады. Салыстырмалы түрде аз, біз оңтайлы систолалық қысым деп атаймыз.

    100-ден 120 мм рт.ст. - ға дейін. 13-суреттегі ең көп таралған интервал, сондықтан жоғарыда анықталған режим, 160-180 жылдардағы Екінші шың екінші тарату режимі деп аталады. Біз бұл таралу формасын бимодальды деп атаймыз. Бірнеше режиммен бөлу денсаулық сақтау деректерінде өте ерекше, және біз олардың біреуін көргенде, бірге бірнеше популяция бар деп күдіктенуіміз керек. Біз бөлуді 13-суретте көрсетілгендей шыңдардың нақты бөлінуі болған жағдайда ғана бимодальды деп санаймыз. Суретте көрсетілгендей біркелкі емес соққылар. 4 және сурет. 5, жеке режимдерге жатпайды. Біз көретін барлық дерлік таратулар унимодальды.

    Режимдер санына, таралу құйрықтарының мөлшері мен пішініне, экстреманың жанындағы гистограмма бөліктеріне қарағанда әлдеқайда қызықты. 14-суретте Venus I сынағына жіберілген 222 әйелдің таралу биіктігі көрсетілген.

    Сурет 14. Венера I сынағына жіберілген 222 әйелдің биіктігі

    Бұл үлестірімде екі құйрық мөлшері мен пішініне өте ұқсас. Егер оң жақтағы құйрық сол жақтағы құйрықпен бірдей ұзындыққа ие болса, онда бөлу симметриялы болып саналады. Құйрықтар шамамен бірдей болуы керек; дәл пішін кез-келген жағдайда бастапқы нүктені таңдауға және аралықтың мөлшеріне байланысты болады.

    Егер оң жақтағы құйрық сол жақтағы құйрықтан ұзын болса, суретте көрсетілген үлестірімдердегідей. 1, сурет. 6 және сурет. 11. үлестіру оң жаққа немесе оң жаққа қисайған. Егер оң жақтағы құйрық сол жақтағы құйрықтан ұзын болса, онда бөлу солға немесе теріс қисыққа ие болады. Бұл атаулар көбінесе адамдарды мазалайды, өйткені егер олар бақылаулардың көпшілігі сол жақта болса, онда бөлуді сол жаққа ауыстыру деп атау керек деп санайды. Алайда, Конвенция-көлбеу бағыты ұзын құйрық бағытында, біз оған жабысып қалдық.

    Теріс бұрмаланған үлестірімдер оң бұрмаланған үлестірімдерге қарағанда әлдеқайда аз кездеседі. Алайда, олар бар және 15-суретте олардың біреуі көрсетілген: туу кезіндегі гестациялық жас.

    Сурет 15. 1749 нәресте үшін гестациялық жас (Брук мәліметтері және басқалар, 1989)

    Бұл жасанды түрде бұрмалануы мүмкін, өйткені жоғарғы құйрықта туылған нәрестелер акушерлік араласудан кейін өз қауіпсіздігі мен аналарының қауіпсіздігі үшін жеткізіледі.

    Медициналық мәліметтердің көпшілігінде симметриялы немесе оң асимметриялық таралу бар. Бөлу формасы біз қолдана алатын талдау әдістері үшін маңызды нұсқаулық болып табылады.

    Негізгі бөлім

    Деректерді визуализациялау, SciVis және InfoVis

    Компьютерлік ғалымдар деректерді визуализацияны сипаттау үшін "ғылыми визуализация" (немесе "SciVis") терминін бұрыннан қолданып келеді, олар екі немесе үш кеңістіктік өлшемде тікелей көрсетіледі (мысалы, картография, компьютерлік томография). Қарама-қарсы,"ақпаратты визуализациялау" (немесе "InfoVis") термині дерексіз деректердің визуализациясын сипаттау үшін қолданылады (мысалы, классикалықдвумерных кестелер, деректер, желілік кестелер). Шамамен 2000 жылдан бастап "деректерді визуализациялау" болды

    осы екі тарихи бөлінген зерттеу салаларын қамтитын біріктіруші термин.

    Биомедициналық мәліметтер жиынтығын жинау және талдау жиі қиын және қымбат. Бір қызығы, бұл деректер визуализацияланған кезде, біз көбінесе деректердегі шынайы заңдылықтарды жасыратын және визуалды артефактілерді енгізетін әдістерді қолданамыз. Болдырмау үшінең жиі кездесетін қателіктер, біз келесі стратегияларды ұсынамыз. (a) кемпірқосақ түстерінің карталарынан аулақ болыңыз (10, 110).

    (b) түстерді минималды түрде қолданыңыз (111); нашар қолданылған түс мүлдем түссізденуден гөрі нашар (112). (c) шатастырылған, толып жатқан визуализацияларды жасаудан аулақ болыңыз (мысалы, шаш кесектері бар графиктер); сүзу немесе кластерлеу арқылы ақпарат мөлшерін азайтыңыз немесе басқа орналасуды қолданыңыз

    (7-сурет). (d) үш өлшемді (3D) визуализацияны тек 3D болып табылатын кеңістіктік деректер үшін қолданыңыз, мысалы, макромолекулалық құрылымдар (113) және дерексіз деректер үшін 3D визуализацияны пайдаланбаңыз. (e) ғылыми зерттеулер мен өнерді араластырмаңыз.

    Жиі қолданылатын мамандандырылған құралдардың көпшілігі оңай жасауға мүмкіндік беретін қуатты мүмкіндіктерді ұсынады әсерлі немесе эстетикалық тартымды визуализация, бірақ негізгі ғылыми мағынасы жасырылған. Бұл мүмкін керемет иллюстрациялар жасау кезінде пайдалы болу (мысалы, мұқабадағы сурет), бірақ бұл деректерді визуализациялаудың мақсатын бұзады әрдайым анық және түсінікті болатын зерттеулер.

    ДЕРЕКТЕРДІ ВИЗУАЛИЗАЦИЯЛАУ ПРИНЦИПТЕРІ

    Деректер көлемі

    Деректерді визуализациялау биомедициналық деректер жиынтығының өсіп келе жатқан көлемін жеңуге қалай көмектеседі?

    Қарапайым жауаптардың бірі-көбірек пиксель алу. Біздің визуалды жүйеміз ерекше мүмкіндіктерге ие ол көптеген ғылыми визуализацияларда ұсынылғаннан гөрі көп ақпаратты өңдей алады, біз қазіргі уақытта жасаймыз. Ақпаратты көзден миға беру жылдамдығы шамамен 10 Мб / с құрайды,сымды интернетке ұқсас (13) және жақсы кодталған визуалды үлгілерді 250 мс ішінде тануға болады(алдын ала) (14). Жоғары ажыратымдылықтағы үлкен дисплейлер біздің визуалды мүмкіндіктерімізді жақсырақ пайдалануға көмектеседі.Мысалы, ноутбукты 4K дисплейіне қосу қосымша мәліметтерді көрудің үнемді әдісі болуы мүмкін және навигация мен жұмыс тиімділігін жақсарту (15). Алайда, үлкен дисплейлер айналады барлық үнемді емес және көбінесе UI басқару элементтері бар. Сонымен қатар, масштабтау көрнекіліктер жаһандық заңдылықтарды қабылдауды қиындатуы мүмкін (мысалы, корреляциялар) (16) - бар екені анықвизуализация үшін оңтайлы Өлшем ауқымы.Сондықтан екінші жауап-деректердің тығыздығы жоғары визуализация жасау. Және мұндабіздің визуалды жүйеміз әдеттегіден гөрі көбірек өткізу қабілетіне ие: артықтық пен контекстке байланыстыкөз нысандарды 0,1 мм (5) дәлдікпен шеше алады. Осылайша, көптеген визуализация зерттеушілері құруды қолдайдыдеректердің тығыздығы жоғары визуализация, бұл көбінесе жоғары қайтарымды журналдарда практикалық талап болып табыладыкеңістік шектеулері (5). Ықшам визуализация жасау визуалды арналарды мұқият таңдауды қажет етеді, деректерді жоғары визуалды тиімділікпен кодтайды. Бақытымызға орай, визуализацияны зерттеу нақты мүмкіндік бередібұл үшін нұсқаулар (сурет 2). Арнайы құралдарды үйрену үшін уақыт пен күш қажет (1-кесте)бұл деректердің жоғары тығыздығы бар үлкен көлемді деректерді визуализациялау үшін қажетті нақты басқару элементтерін ұсынады.Алайда, шектеулер бар: деректердің тығыздығы жоғарылаған сайын, визуализацияның тиімділігін қамтамасыз ету үшін нақты мақсаттар қажет болуы мүмкін

    стратегиялар (17)



    Қосымша көрнекі арналар (рейтингі жоқ): қосылу, оқшаулау / қоршау, айқындық/ ажыратымдылық, жыпылықтау,жолдардың аяқталуы, сызықтардың сызбасы, сызықтардың салмағы, саны, мәтіні, құрылымы, мөлдірлігі, салмағы / батылдығы.

    Сурет 2Сандық кодтау үшін ең тиімді және ең аз тиімді визуалды арналарды (сәйкесінше жоғарыдан төменге) көрсететін визуалды арналардың рейтингі/реттелген немесе категориялық деректер. Бұл рейтингтер жаңа визуализацияны дамытуда және үлгіні зерттеуде пайдалы нұсқаулық бола алады көрнекіліктер(мысалы, 3 және 7А суреттер). Өкінішке орай, сандық деректерді кодтау үшін түсті реңкті қолдану ғылымда әлі де кең таралған. визуализацияны зерттеу бұл визуалды артефактілерді жасау арқылы тиімсіз ғана емес, зиянды да болуы мүмкін екенін анық көрсетедібөлшектерді жасыру (10). Оның орнына (төменгі оң жақ кірістіру) белгілі бір деректер ауқымына (120) бейімделген түрлі-түсті карталарды пайдалану тиімдірек. Сурет 8 сілтеменің рұқсатымен макинле (121) ұсынған және басқалар Кеңейткен (107) тәсіл негізінде бейімделген. Деректердің күрделілігіКөптеген жолдармен, деректердің үлкен көлемі өмір туралы ғылымдардағы шағын мәселе болып табылады. Әлдеқайда күрделі міндетбіздің деректеріміздің күрделілігі, олар көбінесе көп өлшемді, көп өлшемді, бір-бірімен тығыз байланысты және өте нақты жағдайларға байланысты. Мұнда жалпы стратегия-өлшемді азайту үшін аналитикалық әдістерді қолдану (мысалы, кластерлеу,негізгі компоненттерді талдау). Алайда анскомба квартеті (сурет. 1b) бізге не қажет екенін еске салады біз жеңілдетілген ішкі жиынтықтан қорытынды жасамас бұрын барлық тиісті деректерді көзбен тексеріңіз, және өте жиі зерттелген күрделі құбылыстарды білдіру үшін бізге екіден көп айнымалы қажет биомедициналық деректер жиынтығы.



    АНЫҚТАУ ҮШІН ВИЗУАЛИЗАЦИЯ

    Геномика және эпигенетика

    Біз бұл зерттеуді геномика және эпигенетика саласында бастаймыз, онда жылдам прогресс бар ДНҚ секвенирлеу технологиясы деректер ағынын тудырады. Бұл деректер тек өңделмеген деректермен шектелмейді .ДНҚ тізбегі, бірақ бүкіл геномда алуға болатын қосымша ақпараттың көбірек спектрін қамтиды. Мысалы, бисульфиттің бір молекуламен реттелуі мыналарды анықтай алады.әрбір цитозин негізінің метилдену жағдайы, хроматиннің иммунопреципитация реттілігі ақуыз-ДНҚ көрсетуі мүмкін

    хроматиннің ашық аймақтарын анықтау үшін транспозазаның өзара әрекеттесуі мен қол жетімділігі қолданылуы мүмкін (29). Бұл деректер ағынында молекулалық құрылымның, реттеудің бұрын-соңды болмаған егжей-тегжейлері бар және бүкіл организмдердің функциялары, бірақ Сығылған, фрагменттелген және кодталған түрде. Бұл ақпаратты шешуге көмектесу үшін Визуализация кеңінен қолданылады: өте кең таралған тапсырма және жиі жылдамдықты шектейтін қадам-мүмкіндіктер туралы түсінік алу үшін функцияларды қолмен қарау (20). Сызықтық хромосомаларды ұйымдастыру (сурет. 4А) көптеген геномдарға мүмкіндік беретін табиғи визуалды орналасуды қамтамасыз етеді .Нысандар жалпы көлденең масштабта орналасуы керек (сурет. 4b), осылайша, ең тиімді көрнекі арна (сурет. 2)



    РНҚ әлемінің құпияларын ашу туралы; осы уақытта РНҚ транскрипттерінің мазмұнын өлшеу қазіргі биологияның жұмысшысы болды. Алдымен орындалған микрочиптермен тәжірибелер көмегімен (42), биологиялық үлгілердегі транскрипт санын дәл өлшеу

    ал жеке жасушалар (43) қазір РНҚ реттілігі (RNA-seq) (44) арқылы жасалады.



    Визуализация мәселелері.

    РНҚ-seq тәжірибелерінен алынған көп өлшемді мәліметтер жиынтығын түсіндіру қиын міндет болып қала береді. Экспериментті Мұқият жоспарлағаннан және статистикалық талдаудан кейін (45) маңызды деп танылған ген экспрессиясының мәндері әдетте кластерленген жылу карталары түрінде ұсынылады (46), микрочиптермен алғашқы тәжірибелерден бері басым болған әдіс (42). Алайда оптикалықбұл визуализациялардағы иллюзиялар жеке мәндердің шамасын бағалауды қиындатады немесемәндер жұптары арасындағы қатпардың өзгеруі ("жерден туындаған оптикалық иллюзиялар" деп аталатын бүйірлік тақтаны қараңызАзайту). Жолдар мен бағандар саны көбейген сайын немесе ұяшық мөлшері азайған сайын, бұл әсерлер күшейтілген, бұл барлық маңызды нәтижелерді бір үлкен жылу картасы түрінде көрсетуді мүмкін емес етеді.Қосымша проблемалар кластерленген жылу карталарының жолдары мен бағандары әдетте тапсырыс берілгендіктен туындайды байланысты гендер мен күйлерді топтастыру үшін және осылайша реттеуші әсерлерді атап көрсетеді (47). Сөзсіз мағыналар маңызды байланысы жоқ гендер мен күйлер бір-бірінің қасында орналасады, бұл қабылдау проблемаларын күшейтеді. Байланыссыз жолдар мен бағандарды бөлу (сурет. 5А) көмектесе алады,бірақ бұл қиындықтарды түбегейлі шешпейді (48), әсіресе гендер үшін нашар топтастырылған. Мұндай жағдайларда осы гендердің реттеуші желілерін анықтау үшін деректер жеткіліксіз болуы мүмкін түрінде бірөлшемді ретке келтіру, сондықтан, сондай-ақ көрсетілді дәрежесі қолдау және өзара байланысты, пайдаланудан шығарылған кластерлеу.



    Пайдаланылған әдебиеттер тізімі:

    1. O’Donoghue SI, Gavin A-C, Gehlenborg N, Goodsell DS, Herich ´ e J-K, et al. 2010. Visualizing ´ biological data—now and in the future. Nat. Methods 7:S2–4

    2. Tufte ER. 2009. The Visual Display of Quantitative Information. Cheshire, CT: Graphics

    3. Evanko D. 2013. Data visualization: a view of every Points of View column. Methagora: A Blog from Nature Methods, July 13. http://blogs.nature.com/methagora/2013/07/data-visualizationpoints-of-view.html

    4. Rougier NP, Droettboom M, Bourne PE. 2014. Ten simple rules for better figures. PLOS Comput. Biol. 10:e100383

    5. Munzner T. 2014. Visualization Analysis and Design. Boca Raton, FL: CRC

    6. Bland M. (2000) An Introduction to Medical Statistics. Oxford, University Press.

    7. Brooke OG, Anderson HR, Bland JM, Peacock JL, Stewart CM. (1989) Effects on birth weight of smoking, alcohol, caffeine, socioeconomic factors, and psychosocial stress. British Medical Journal298, 795-801.

    8. Friedland JS, Porter JC, Daryanani S, Bland JM, Screaton NJ, Vesely MJJ, Griffin GE, Bennett ED, Remick DG. (1996) Plasma proinflammatory cytokine concentrations, Acute Physiology and Chronic Health Evaluation (APACHE) III scores and survival in patients in an intensive care unit. Critical Care Medicine 24, 1775-81.

    9. Frost H, Lamb SE, Doll HA, Carver PT, Stewart-Brown S. (2004) Randomised controlled trial of physiotherapy compared with advice for low back pain. British Medical Journal 329, 708-711.

    10. Markus HS, Barley J, Lunt R, Bland JM, Jeffery S, Carter ND, Brown MM. (1995) Angiotensin-converting enzyme gene deletion polymorphism: a new risk factor for lacunar stroke but not carotid atheroma. Stroke 26, 1329-33.

    11. Nelson EA, Iglesias CP, Cullum N, Torgerson DJ. (2004) Randomized clinical trial of four-layer and short-stretch compression bandages for venous leg ulcers (VenUS I). British Journal of Surgery 91, 1292-1299.


    написать администратору сайта