Ово су најбољи бесплатни извори отворених података које свако може да користи

Шта су отворени подаци?

Једноставно речено, отворени подаци означавају врсту података која је свима и свима отворена за приступ, модификовање, поновну употребу и дељење.

Отворени подаци темеље се на разним „отвореним покретима“ као што су отворени код, отворени хардвер, отворена влада, отворена наука итд.

Владе, независне организације и агенције јавиле су се да отворе прелазе података како би створиле све више отворених података за слободан и лак приступ.

Зашто су отворени подаци важни?

Отворени подаци су важни јер је свет све више вођен подацима. Али ако постоје ограничења у приступу и употреби података, идеја пословања и управљања заснованог на подацима неће се остварити.

Стога отворени подаци имају своје јединствено место. Може омогућити потпуније разумевање глобалних проблема и универзалних проблема. То може дати велики подстицај предузећима. То може бити велики подстицај за машинско учење. Може помоћи у борби против глобалних проблема попут болести или злочина или глади. Отворени подаци могу оснажити грађане, а тиме и ојачати демократију. Може усмјерити процесе и системе које су изградиле друштво и владе. Може вам помоћи да трансформишемо начин на који разумемо и комуницирамо са светом.

Дакле, ево моје листе од 15 сјајних извора података:

1. Отворени подаци Светске банке

Као спремиште најопсежнијих светских података о ономе што се догађа у различитим земљама широм света, Отворени подаци Светске банке су витални извор отворених података. Такође омогућава приступ другим скуповима података који су поменути у каталогу података.

Отворени подаци Светске банке су огромни јер има 3000 скупова података и 14000 индикатора који укључују микроподатке, статистику временских серија и геопросторне податке.

Приступ и откривање података које желите такође је прилично лако. Све што треба да урадите је да одредите имена индикатора, државе или теме и то ће вам отворити ризницу отворених података. Такође вам омогућава преузимање података у различитим форматима као што су ЦСВ, Екцел и КСМЛ.

Ако сте новинар или академик, бићете одушевљени низом алата који су вам на располагању. Можете добити приступ алатима за анализу и визуелизацију који могу појачати ваше истраживање. Може поздравити дубље и боље разумевање глобалних проблема.

Можете добити приступ АПИ-ју који вам може помоћи да креирате визуализације података које су вам потребне, комбинације уживо са другим изворима података и још много таквих функција.

Стога није изненађење да су отворени подаци Светске банке на врху било које листе отворених података!

2. СЗО (Светска здравствена организација) - Отворено складиште података

Складиште отворених података СЗО је начин на који СЗО води евиденцију о здравственим статистикама својих 194 државе чланице.

Спремиште систематски одржава податке. Може му се приступити према различитим потребама. На пример, било да се ради о смртности или оптерећењу болестима, могу се приступити подацима класификованим под 100 или више категорија као што су Миленијумски развојни циљеви (дечја исхрана, здравље детета, материнско и репродуктивно здравље, имунизација, ХИВ / АИДС, туберкулоза, маларија, занемарене болести, вода и санитарни услови), незаразне болести и фактори ризика, епидемије склоне болести, здравствени системи, здравље животне средине, насиље и повреде, правичност итд.

За своје специфичне потребе можете прегледати скупове података према темама, категорији, индикатору и земљи.

Добра ствар је што је могуће преузети све податке који су вам потребни у Екцел формату. Такође можете надгледати и анализирати податке користећи његов портал података.

Доступан је и АПИ података и статистичких података Светске здравствене организације.

3. Гоогле јавни истраживач података

Покренут 2010. године, Гоогле Публиц Дата Екплорер вам може помоћи да истражите огромне количине скупова података од јавног интереса. Можете да визуализујете и преносите податке за одговарајућу употребу.

Омогућава доступност података из различитих агенција и извора. На пример, можете приступити подацима Светске банке, Америчког бироа за статистику рада и Америчког бироа, ОЕЦД-а, ММФ-а и других.

Различите заинтересоване стране приступају овим подацима у различите сврхе. Било да сте студент или новинар, било да сте креатор политике или академик, можете користити овај алат како бисте креирали визуализације јавних података.

Помоћу програма Дата Екплорер можете да примените различите начине представљања података као што су линијски графикони, тракасти графикони, мапе и графикони са облачићима.

Најбоље је то што би вам ове визуализације биле прилично динамичне. То значи да ћете видети како се временом мењају. Можете да мењате теме, да се усредсредите на различите уносе и да измените скалу.

Такође се лако може делити. Чим припремите графикон, можете га уградити на своју веб страницу или блог или једноставно делити везу са пријатељима.

4. Регистар отворених података о АВС (РОДА)

Ово је спремиште које садржи јавне скупове података. Подаци су доступни из АВС извора.

Што се тиче РОДА-е, можете открити и делити податке који су јавно доступни.

У РОДА-и можете да користите кључне речи и ознаке за уобичајене типове података као што су геномски, сателитски снимци и транспорт како бисте претражили све податке које тражите. Све ово је могуће на једноставном веб интерфејсу.

За сваки скуп података открићете страницу са детаљима, примере употребе, информације о лиценцама и упутства или апликације које користе ове податке.

Користећи широк спектар рачунарских производа и производа за аналитику података, можете да анализирате отворене податке и направите све услуге које желите.

Иако су подаци којима приступате доступни путем АВС ресурса, морате имати на уму да их АВС не пружа. Ови подаци припадају различитим агенцијама, владиним организацијама, истраживачима, предузећима и појединцима.

5. Портал отворених података Европске уније

Можете приступити ономе што отворене податке објављују институције ЕУ, агенције и друге организације на јединственој платформи, односно Порталу отворених података Европске уније.

Портал отворених података ЕУ дом је виталних отворених података који се односе на домене политика ЕУ. Ови домени политике укључују економију, запошљавање, науку, животну средину и образовање.

Око 70 институција, организација или одељења ЕУ, попут Еуростата, Европске агенције за животну средину, Заједничког истраживачког центра и других генералних директората Европске комисије и агенција ЕУ, објавили су своје базе података и дозволили им приступ. Ови скупови података прешли су број од 11700 до данас.

Портал омогућава лак приступ. Податке можете лако претраживати, истраживати, повезивати, преузимати и поново користити кроз каталог уобичајених метаподатака. То можете учинити за своје специфичне сврхе. То може бити у комерцијалне или некомерцијалне сврхе.

Каталог метаподатака можете претраживати путем интерактивног претраживача (картица Подаци) и СПАРКЛ упита (картица Повезани подаци).

Коришћењем овог каталога можете добити приступ подацима који се чувају на различитим веб локацијама институција, агенција и организација ЕУ.

6. ФивеТхиртиЕигхт

То је сјајна страница за новинарство на основу података и причање прича.

Пружа своје различите изворе података за разне секторе као што су политика, спорт, наука, економија итд. Податке такође можете преузети.

Када приступите подацима, наићи ћете на кратко објашњење у вези са сваким скупом података с обзиром на његов извор. Такође ћете сазнати шта значи и како га користити.

Да би ове податке учинио једноставним за употребу, он нуди скупове података у што једноставнијим, незаштићеним форматима као што су ЦСВ датотеке. Непотребно је рећи да овим форматима људи могу лако да приступе и обраде их, као и машине.

Уз помоћ ових скупова података можете да креирате приче и визуелизације у складу са сопственим захтевима и жељама.

7. Амерички биро за попис

Амерички пописни биро је највећа статистичка агенција савезне владе. Чува и пружа поуздане чињенице и податке о људима, местима и економији Америке.

Пописни биро сматра своју племениту мисију ширењем својих услуга најпоузданијим пружаоцем квалитетних података.

Било да се ради о савезној, државној, локалној или племенској влади, сви они користе пописне податке у разне сврхе. Ове владе користе ове податке за одређивање локације новог становања и јавних објеката. Такође га користе у време испитивања демографских карактеристика заједница, држава и САД-а.

Ови подаци се такође користе у планирању транспортних система и путева. Када је реч о одлучивању о квотама и стварању полицијских и ватрогасних станица, ови подаци добро дођу. Када владе креирају локализована подручја за изборе, школе, комуналне службе итд., Они користе ове податке. Пракса је да се подаци о становништву прикупљају једном у деценији и ти подаци су врло корисни у постизању истих.

Постоје разни алати као што су Америцан Фацт Финдер, Ценсус Дата Екплорер и Куицк Фацтс који су корисни у случају да желите да претражите, прилагодите и визуализујете податке.

На пример, Куицк Фацтс садржи статистику свих држава, округа, градова, па чак и градова са 5000 или више становника.

Слично томе, Америцан Фацт Финдер вам може помоћи да откријете популарне чињенице као што су становништво, приход итд. Пружа информације које се често траже.

Добра ствар је што путем претраживача података пописа можете да претражујете податке, комуницирате са њима, упознате се са популарним статистикама и видите повезане графиконе. Штавише, визуелни алат такође можете да прилагодите подацима на интерактивном искуству мапа.

8. Дата.гов

Дата.гов је ризница отворених података америчке владе. Тек недавно донета је одлука да се сви владини подаци учине доступним бесплатно.

Када је покренут, било их је само 47. Сада постоји 180.000 скупова података.

Зашто је Дата.гов сјајан ресурс зато што можете пронаћи податке, алате и ресурсе које можете применити у разне сврхе. Можете да спроводите своја истраживања, развијате веб и мобилне апликације, па чак и да дизајнирате визуелизацију података.

Све што треба да урадите је да у оквир за претрагу унесете кључне речи и претражите врсте, ознаке, формате, групе, типове организација, организације и категорије. Ово ће олакшати лак приступ подацима или скуповима података који су вам потребни.

Дата.гов следи Пројектну шему података - скуп потребних поља (наслов, опис, ознаке, последње ажурирање, издавач, име контакта итд.) За сваки скуп података приказан на Дата.гов.

9. ДБпедиа

Као што знате, Википедиа је одличан извор информација. ДБпедиа има за циљ добијање структурираног садржаја од драгоцених информација које је Википедиа створила.

Помоћу ДБпедије можете семантички претраживати и истраживати односе и својства ресурса Википедиа. То укључује и везе до других сродних скупова података.

У скупу података ДБпедиа постоји око 4,58 милиона ентитета. У онтологију је класификовано 4,22 милиона, укључујући 1.445.000 особа, 735.000 места, 123.000 музичких албума, 87.000 филмова, 19.000 видео игара, 241.000 организација, 251.000 врста и 6.000 болести.

Постоје ознаке и сажеци за ове ентитете на око 125 језика. Постоји 25,2 милиона веза до слика. Постоји 29,8 милиона веза до спољних веб страница.

Све што треба да урадите да бисте користили ДБпедију је писање СПАРКЛ упита против крајње тачке или преузимање њихових одлагалишта.

ДБпедиа је профитирала од неколико предузећа, попут Аппле-а (путем Сири-ја), Гоогле-а (путем Фреебасе-а и Гоогле-овог Графа знања) и ИБМ-а (преко Ватсона), а посебно њихових престижних пројеката повезаних са вештачком интелигенцијом.

10. фрееЦодеЦамп Опен Дата

То је заједница отвореног кода. Зашто је то важно јер вам омогућава да кодирате, градите про боно пројекте након непрофитних организација и запослите се као програмер.

Да би се ово догодило, заједница фрееЦодеЦамп.орг сваког месеца ставља на располагање огромне количине података. Претворили су га у отворене податке.

Пронаћи ћете разне ствари у овом спремишту. Можете пронаћи скупове података, анализу истих, па чак и демонстрације пројеката заснованих на подацима фрееЦодеЦамп. Такође можете пронаћи везе до спољних пројеката који укључују податке фрееЦодеЦамп.

Може вам помоћи у различитим пројектима и задацима које можда имате на уму. Било да се ради о веб аналитици, аналитици друштвених медија, анализи друштвених мрежа, анализи образовања, визуелизацији података, веб развоју на основу података или ботовима, подаци које нуди ова заједница могу бити изузетно корисни и ефикасни.

11. Иелп отворени скупови података

Иелп скуп података у основи је подскуп ничега осим нашег сопственог пословања, рецензија и корисничких података за употребу у личним, образовним и академским активностима.

У Иелп Опен Датасетс је укључено 5.996.996 рецензија, 188.593 предузећа, 280.991 слика и 10 градских подручја.

Можете их користити у различите сврхе. Будући да су доступне као ЈСОН датотеке, можете их користити да бисте ученике подучавали о базама података. Можете их користити за учење НЛП-а или за узорковање производних података док разумете како да дизајнирате мобилне апликације.

У овом скупу података пронаћи ћете сваку датотеку која се састоји од једног типа објекта, једног ЈСОН-објекта по линији.

12. УНИЦЕФ-ов скуп података

Будући да се УНИЦЕФ бави широким спектром критичних питања, прикупио је релевантне податке о образовању, дечјем раду, инвалидности детета, смртности деце, смртности мајки, води и санитарним условима, малој порођајној тежини, антенаталној нези, пнеумонији, маларији, недостатку јода поремећај, сакаћење / сечење женских гениталија и адолесценти.

Отворени УНИЦЕФ-ови скупови података објављени у ИАТИ-овом регистру: //ввв.иатирегистри.орг/публисхер/уницеф извучени су директно из УНИЦЕФ-овог оперативног система (ВИСИОН) и других система података, а одражавају уносе појединачних канцеларија УНИЦЕФ-а.

Добра ствар је што се редовно ажурирају што се тиче ових скупова података. Подаци се ажурирају сваког месеца како би постали свеобухватнији, поузданији и тачнији.

Овим подацима можете слободно и лако приступити. Да бисте то урадили, можете да преузмете ове податке у ЦСВ формату. Можете и да прегледате узорке података пре него што их преузмете.

Иако свако може истражити и визуализирати УНИЦЕФ-ове скупове података, постоје три главна издавача:

УНИЦЕФОВ ПОРТАЛ ПРОПИСНОСТИ ПОМОЋИ: Много лакше можете приступити скуповима података ако користите овај портал. Такође укључује детаље о свакој земљи у којој УНИЦЕФ ради.

Д-портал издавача: Тренутно је у БЕТА верзији. Помоћу овог портала можете истраживати ИАТИ податке.

Можете претраживати информације које се односе на развојне активности, буџете итд. Ове податке можете истражити по земљама.

Издавачева платформа података: На овој платформи можете лако приступити статистикама, графиконима и показатељима података којима се приступа преко ИАТИ регистра. Ако кликнете на заглавља, такође можете да сортирате многе табеле које видите на платформи. Такође ћете пронаћи мноштво скупова података на платформама у машински читљивом ЈСОН формату.

13. Каггле

Каггле је сјајан јер промовише употребу различитих формата публикација скупова података. Међутим, бољи део је тај што снажно препоручује издавачима скупова података да своје податке деле у приступачном, неластничком формату.

Платформа подржава отворене и доступне формате података. Важно је не само за приступ већ и за све што желите да урадите са овим подацима. Стога, Каггле Датасет јасно дефинише формате датотека који се препоручују приликом дељења података.

Јединствена ствар код скупова података Каггле је да то није само спремиште података. Сваки скуп података представља заједницу која вам омогућава да разговарате о подацима, сазнате јавне кодове и технике и концептуализујете сопствене пројекте у језгри.

ЦСВ, ЈСОН, СКЛите, Арцхиве, Биг Куери итд. Су врсте датотека које Каггле подржава. Можете пронаћи разне ресурсе како бисте започели рад на пројекту отворених података.

Најбољи део је што вам Каггле омогућава да објављујете и делите скупове података приватно или јавно.

14. ЛОДУМ

То је иницијатива за отворене податке Универзитета у Минстеру. У оквиру ове иницијативе, свима је омогућен приступ било којим јавним информацијама о универзитету у машински читљивим форматима. Можете му лако приступити и поново га користити према вашим потребама.

Отворени подаци о научним артефактима и кодирани као повезани подаци доступни су у оквиру овог пројекта.

Уз помоћ повезаних података могуће је делити и користити податке, онтологије и разне стандарде метаподатака. Заправо се предвиђа да ће то бити прихваћени стандард за пружање метаподатака и самих података на мрежи.

Тим ЛОДУМ-а је суорганизатор ЛинкедУниверситиес.орг и ЛинкедСциенце.орг.

За анализу података можете користити СПАРКЛ уређивач или СПАРКЛ пакет Р.

СПАРКЛ пакет омогућава повезивање са СПАРКЛ крајњом тачком преко ХТТП-а, постављање СЕЛЕЦТ упита или упита за ажурирање (ЛОАД, ИНСЕРТ, ДЕЛЕТЕ).

15. УЦИ спремиште за машинско учење

Служи као свеобухватно спремиште база података, теорија домена и генератора података које заједница машинског учења користи за емпиријску анализу алгоритама машинског учења.

У овом спремишту тренутно постоји 463 скупа података као услуга заједници машинског учења.

Центар за машинско учење и интелигентне системе на Универзитету у Калифорнији, Ирвине, домаћин је и одржава. Давид Аха га је првобитно створио као постдипломац на УЦ Ирвине.

Од тада га ученици, наставници и истраживачи широм света користе као поуздан извор скупова података о машинском учењу.

Како то функционише је да сваки скуп података има своју засебну веб страницу која садржи све познате детаље, укључујући све релевантне публикације које га истражују. Ове скупове података можете преузети као АСЦИИ датотеке, често корисни ЦСВ формат.

Детаљи скупова података сумирани су по аспектима попут типова атрибута, броја инстанци, броја атрибута и објављене године који се могу сортирати и претраживати.

Портали отворених података и претраживачи:

Иако постоји много скупова података које сваке године објављују бројне агенције, врло мало скупова података постаје препознато и успостављено.

Разлог зашто врло мало таквих скупова података одржава као користан ресурс је тај што је изазов развити, управљати и пружати податке на начин да људи и организације сматрају да су корисни и једноставни за употребу.

Међутим, испод можете пронаћи списак осталих неколико важних портала и платформи отворених података који омогућавају корисницима приступ прилично отвореним подацима, проучавање утицаја и прикупљање драгоцених увида.

  1. Гоогле претрага скупа података
  2. Датаверсе
  3. Отворите комплет података
  4. Цкан
  5. Отворите Монитор података
  6. Пленар.ио
  7. Отворите мапу утицаја података

Закључак

Отворени подаци су редослед дана. Свет је постепено почео да се креће ка отвореним системима и отворени подаци су с тим у складу.

Посао и организације који користе отворене податке добиће конкурентску предност и моћи ће да доминирају у будућности.