Научна неуронска података: како и зашто

Груби водич за бављење науком о подацима о неуронима

Мозак који ради на науци о подацима. Заслуга: Мозак Матт Вассер-а из пројекта Ноун

Тихо, прикривено, обликује се нови тип неурознанственика. Из небројених низа теоретичара израсли су тимови неурознанственица који раде науке са подацима о неуролошкој активности, о ријетким копањима стотина неурона. Не креирање метода за анализу података, мада то раде и сви. Не прикупљање тих података, јер за то је потребан други сјајан сет вештина. Али неурознанственици користе читаву гаму савремених рачунарских техника на тим подацима да одговоре на научна питања о мозгу. Појавила се наука о неуронским подацима.

Испада да сам један од њих, овај клан научника о неуронским подацима. Случајно. Колико могу рећи, тако се рађају сва научна поља: случајно. Истраживачи прате нос, почињу да раде нове ствари и одједном нађу мали број људи у кухињи на забавама (јер тамо су пића, у фрижидеру - научници су паметни). Дакле, овде је мали манифест о науци о неуронским подацима: зашто се појављује и како бисмо могли да то урадимо.

Зашто је исто као у свим областима науке које су избациле науку о подацима: количина података измиче из руку. За науку о снимању пуно неурона, ово копање података има својеврсно научно утемељење. Мозак делује тако што прослеђује поруке између неурона. Већина тих порука има облик ситних импулса електричне енергије: шиљака, називамо их. Многима се чини логично да ако желимо да схватимо како мозгови раде (а када не раде), морамо да снимимо све поруке које се преносе између свих неурона. А то значи да снимате што више шиљака са што више неурона.

Мозак бебе зебрафисх има око 130.000 неурона и најмање милион веза између њих; мозак бубамара има око милион неурона. Можете видети како би то врло брзо могло испасти из руке. Тренутно снимамо негде између десетина до неколико стотина неурона истовремено са стандардним китом. На границама су људи који снимају неколико хиљада, па чак и неколико њих који добивају десетине хиљада (иако ове снимке снимају активност неурона брзином већом од оне коју неурони могу слати).

Овај систем лудила називамо неурознаност: неурознаност, за проучавање неурона; системима, за одважност снимања са више неурона истовремено. А подаци су комплексно савијани. Оно што имамо су десетине до хиљаде истовремено снимљених временских серија, сваки ток шиљастих догађаја (стварни шиљци или нека њихова индиректна мера) из једног неурона. По дефиницији, они нису стационарни, њихова статистика се временом мења. Њихова стопа активности проширила се на многобројне величине, од тихог размишљања попут монаха, до „бубњарског комплета у тунелу“. А њихови обрасци активности крећу се од правилности у облику сата, до муцања и дробљења, до измене између налета маније и исцрпљености.

Сада се удајте за понашање животиње из које сте снимили неуроне. Ово понашање представља стотине суђења избора; или покрети руку; или руте које се воде кроз окружење. Или покрета чулног органа или целокупног држања мускулатуре. Поновите за више животиња. Вероватно више регија мозга. А понекад и читав мозак.

Ми немамо основану истину. Не постоји тачан одговор; не постоје ознаке за обуку података, осим понашања. Не знамо како мозак кодира понашање. Дакле, можемо радити ствари с етикетама у понашању, али готово увек знамо да то није одговор. Они су само трагови „одговора“.

Системска неурознаност је тада богато игралиште за оне који своје знање о неурознаности могу повезати са својим знањем за анализу података. Рођена је наука о неуронским подацима.

Како се - или би то могло - урадити? Ево грубог водича. Разлог динезе научника са неуролошким подацима јесте да поставља научна питања о подацима из неуронауке система; да се запитам: како сви ови неурони раде заједно да раде своје ствари?

Постоје отприлике три начина на која можемо одговорити на то питање. Ова три начина можемо видети гледајући кореспонденцију између утврђених класа проблема у машинском учењу и рачунских изазова у системској неурознаности. Започнимо са прегледом онога са чим морамо радити.

Имамо неке податке из н неурона које смо прикупили током времена. Скупит ћемо их у матрицу коју ћемо звати Кс - онолико ступаца колико неурона и онолико редака колико временских тачака смо снимили (где је на нама колико траје тачка „тачка“: можда Укратко, и само сваки запис уноса има 1 за бодљику, а 0 у супротном. Или ћемо можда учинити дугачким и сваки унос бележи број бодова током тог протеклог времена). Током тог времена у свету се дешавају ствари - укључујући и оно што тело ради. Дакле, скупимо све то у матрицу коју ћемо звати С - онолико ступаца колико има функција у свету о којима нам је важно и исто толико редова као што су временске тачке снимљене за те функције.

Традиционално, машинско учење укључује изградњу три класе модела о стању света и доступним подацима: генеративном, дискриминативном и густинским. Као груби водич, ова табела приказује како свака класа одговара основном питању у системској неурознаности:

1 / Модели густине П (Кс): да ли постоји структура у шиљцима? Звучи глупо. Али у ствари је то кључно за велике резултате истраживања неуронауке, у којима желимо знати утицај нечега (лека, понашања, сна) на мозак; у којем се питамо: како се променила структура неуронске активности?

Снимањем гомиле неурона, на то можемо одговорити на три начина.

Прво, можемо квантификовати шиљаст влак сваког неурона, мерењем статистичких података сваког Кс-овог ступца, као брзина убода. А онда се запитајте: шта је модел П (Кс) за ове статистике? Можемо групирати ове статистике да бисмо пронашли „врсте” неурона; или једноставно уклопите моделе на целокупну заједничку дистрибуцију. Било како било, имамо неки модел структуре података о грануларности појединих неурона.

Друго, можемо створити генеративне моделе целокупне активности становништва, користећи редове Кс - векторе тренутне активности читавог становништва. Овакви модели обично имају за циљ да разумеју колико Кс структуре може да се рекреира из само неколико ограничења, било да је то дистрибуција колико вектора има колико шиљака; или парних корелација између неурона; или њихове комбинације Они су посебно корисни за израду ако у активностима становништва постоји неки посебан умак, ако је ишта више од колективне активности скупа независних или досадно једноставних неурона.

Треће, можемо заузети став да је неуронска активност у Кс нека висока димензионална реализација малог димензионалног простора, где је број димензија Д << н. Обично мислимо на ово: неки неурони у Кс су у корелацији, тако да не треба да користимо читав Кс да бисмо разумели популацију - уместо тога можемо да их заменимо са много једноставнијом представом. Могли бисмо директно групирати временску серију, тако да декомпонујемо Кс у скуп од Н мањих матрица Кс_1 до Кс_Н, а свака од њих има (релативно) снажне корелације унутар себе, па се могу третирати независно. Или бисмо могли да употријебимо неку врсту приступа смањењу димензија попут анализе главних компоненти како бисмо добили мали временски низ који сваки описује један доминантан облик варијације у активности становништва током времена.

Можемо више од овога. Горе наведено претпоставља да желимо да смањимо димензију за колапс неурона - да применимо редукцију на ступове Кс. Али могли бисмо једнако лако да урушимо време, примењујући смањење димензија на редове Кс. Уместо да питамо је ли неуронска активност сувишна , ово је питање да ли различити тренуци времена имају сличне обрасце неуронске активности. Ако их има само неколицина, динамика снимљених неурона је врло једноставна.

И овде можемо убацити динамичке системске приступе. Овде покушавамо да прилагодимо једноставне моделе променама у Кс током времена (тј. Мапирање из једног реда у други) и користимо те моделе да квантификујемо врсте динамике коју Кс садржи - користећи изразе као што су „привлачник“, „сепаратрик“, „ седални чвор “, бифуркација вилића“ и „колапс Арсенала“ (само један од њих није стварна ствар). Могуће је тврдити да су тако опремљени динамички модели сви модели густине П (Кс), јер описују структуру података.

Пакао, могли бисмо чак да покушамо да уклопимо читав динамички модел неуронског круга, гомилу диференцијалних једначина који описују сваки неурон, на Кс, тако да се наш модел П (Кс) узоркује сваки пут када покренемо модел из различитих почетних услова .

Помоћу ових модела густине можемо их засебно прилагодити неуронским активностима које смо забележили у гомили различитих стања (С1, С2, ..., См) и одговорити на питања попут: како се структура популације неурона мења између спавања и будност? Или током развоја животиње? Или током учења задатка (где би С1 могао бити пробни 1, а С2 пробни рад 2, или С1 је сесија 1 и С2 сесија 2; или многе комбинације истих). Такође се можемо питати: колико димензија обухвата активност неурона? Да ли се димензије разликују између различитих подручја кортекса? И да ли је неко видео моје кључеве?

2 / Генеративни модели П (Кс | С): шта изазива шиљ? Сада разговарамо. Ствари попут линеарно-нелинеарних модела или генерализованих линеарних модела. Типично се ови модели примењују на појединачне неуроне, у сваки ступац Кс. Помоћу њих уклапамо модел који користи стање света С као улаз и избацује низ неуронских активности који се подударају са активношћу неурона што је могуће ближе. Затим увидом у пондерирање датог својства С у репродукцији активности неурона, можемо утврдити за шта се чини да тај неурон изгледа.

Можда бисмо желели да одаберемо модел који има одређену флексибилност у ономе што се сматра „стањем света“. Можемо укључити сопствену активност неурона као карактеристику и видети да ли је мар за оно што је радио у прошлости. За неке врсте неурона одговор је "да". Пукнуће може пуно да изађе из неурона, а он мора да легне на одмор за неколико дана како би поново могао да прође. Такође можемо размишљати шире, и укључити остатак популације - остатак Кс - као део државе света док неурон пуца. Уосталом, неурони повремено утичу на пуцање једних других, или су ме на то веровали. Дакле, постоји мала шанса да одговор неурона у визуелном кортексу није само усмерен на оријентацију ивице у спољашњем свету, већ може да зависи и од оног што раде 10000 кортикалних неурона. Оно што онда учимо су отприлике најутицајнији неурони у популацији.

Не морамо примењивати ове генеративне моделе на појединачне неуроне. Можемо их подједнако применити на наше моделе густине; можемо се питати шта сваки кластер или димензија кодира о свету. Или, као што су то неки људи радили овде, и ми можемо користити сам модел густине као стање у свету и питати се које карактеристике тог модела низводних неурона проклето стварају.

Врсте питања на која можемо одговорити овим генеративним моделима прилично су очигледне: која комбинација карактеристика најбоље предвиђа одговор неурона? Да ли су неурони селективни за само једну ствар? Како неурони утичу једни на друге?

3 / Дискриминаторни модели П (С | Кс): Које информације носе шиљци? Ово је основно питање у неурознаности система, јер је то изазов са којим су суочени сви неурони који су низводно од наше забележене популације - сви неурони који примају улазе од неурона из којих смо забележили и који су набијени у нашој матрици Кс. За оне низводне неуроне морају закључити шта они морају знати о спољном свету који се заснива искључиво на шиљцима.

Овде можемо користити стандардне класификаторе који пресликавају улазе на означене излазе. Можете користити редове Кс као улаз, сваки снимак активности становништва и покушати предвидјети једну, неку или све карактеристике у одговарајућим редовима С. Могуће с временским одгађањем, па користимо ред Кс_т за предвидјети стање С_т-н које је у прошлости било н корака ако нас занима како популација кодира стање које улази у мозак; или можемо користити ред Кс_т да предвидимо стање С_т + н које је н корак у будућност ако нас занима како популације кодирају неки утицај мозга на свет. Као и активност у моторичком кортексу која се дешава пре него што одмах упишем свако слово.

Било како било, узмемо неке (али не све, јер не испуњавамо) редове Кс и обучимо класификатор како би пронашли најбоље могуће пресликавање Кс у одговарајући део С. Затим тестирамо класификатор колико добро може предвидите остатак С из одговарајућег остатка Кс. Ако имате изванредну срећу, ваши Кс и С могу бити толико дуги да их можете поделити на скупове за влак, тестирање и потврду. Задњу чувајте у закључаној кутији.

Наравно да бисмо могли да употребимо што јачи класификатор. Од логистичке регресије, преко Баиесових приступа, па све до употребе неуронске мреже од 23 слоја. Радије зависи од тога шта желите од одговора и компромиса између интерпретације и моћи у којој вам је пријатно. Моја писања негде другде јасно су објаснила којој страни овог компромиса се залажем. Али срећан сам што сам доказао да нисам у праву.

Модели кодирања неурона су увидљиви, али додирују неке старе и дубоке филозофске потешкоће. Тестирање кодирања дискриминативним моделом претпоставља да нешто низводно покушава декодирати С од неуронске активности. Постоје два проблема са тим. Неурони се не дешифрују; неурони узимају шиљке као улаз и излазе своје властите шиљке. Уместо тога, они се прекодирају из једног низа шиљака у други скуп шиљака: можда мањи или спорији; можда више или брже; можда из устаљеног тока у осцилацију. Тако се дискриминирајући модели тачније питају које информације наши неурони поново кодирају. Али чак и ако заузмемо ово гледиште, постоји дубљи проблем.

Уз врло мало изузетака, не постоји неурона „низводно“. Неурони које смо забиљежили на Кс делују су замршено жичаним мозгом, пуним бесконачних петљи; њихов резултат утиче на њихов сопствени унос. Што је још горе, неки неурони у Кс-у су низводно од осталих: неки од њих улазе директно у остале. Јер, као што је горе наведено, неурони утичу једни на друге.

Груб, можда користан манифест за науку о неуронским подацима. Непотпуно је; без сумње нешто горе није у реду (одговара на разгледници на уобичајену адресу). Наведено је покушај синтетизације рада групе лабораторија са врло различитим интересовањима, али уобичајена тежња да се такве врсте модела користе на великим скупинама неуронских података да би се одговорило на дубока питања о томе како функционирају мозгови. Многи од њих су лабораторији података, тимови који анализирају експерименталне податке да одговоре на своја питања; да набројимо неколико - Јохнатхан Јастук; Цхристиан Мацхенс; Конрад Кординг; Канака Рајан; Јохн Цуннингхам; Адриенне Фаирхалл; Пхилип Беренс; Циан О'Доннелл; Ил Мемминг Парк; Јакоб Мацке; Гашпер Ткацик; Оливер Марре Хм, ја. Други су експериментални лабораторији са јаким наклоностима података: Анне Цхурцхланд; Марк Цхурцхланд; Ницоле Руст; Крисхна Схенои; Царлос Броди; многи други се извињавам што нисам именовао.

Постоје конференције на којима је такав рад добродошао, наи чак и охрабрен. Часопис за науку о неуронским подацима је на путу. Нешто се гради. Уђите, подаци су лепи *.

* да, морао сам да се обраћам подацима као једнини да бих успео да учиним ту шалу. Чињеница да напишем ову фусноту да бих вам објаснила то ће вам дати неку идеју о фасцинантној пажњи на детаље о неуронским подацима који научници очекују.

Желим више? Пратите нас на адреси Тхе Спике

Твиттер: @маркдхумпхриес