tag :: dataset | BibSonomy

закладки (спрятать)743
показать
всё
только закладки
закладки на страницу
5
10
20
50
100
RSS
BibTeX
XML

1TLC Trip Record Data - TLC
https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page
3 лет назад , @jaeschke
data
dataset
ny
nyt
taxi
datadatasetnynyttaxi
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Google AI Blog: KELM: Integrating Knowledge Graphs with Language Model Pre-training Corpora
https://ai.googleblog.com/2021/05/kelm-integrating-knowledge-graphs-with.html
3 лет назад , @hotho
KG
LM
data
dataset
deep
integration
learning
model
KGLMdatadatasetdeepintegrationlearningmodel
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Whole-cell segmentation of tissue images with human-level performance using large-scale data annotation and deep learning | Nature Biotechnology
https://www.nature.com/articles/s41587-021-01094-0
2 лет назад , @becker
large
dataset
tissue
single
cell
different
technologies
largedatasettissuesinglecelldifferenttechnologies
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Data | Copernicus Marine
https://resources.marine.copernicus.eu/product-detail/GLOBAL_MULTIYEAR_WAV_001_032/INFORMATION
2 лет назад , @annakrause
dataset
neuralpde
ocean
datasetneuralpdeocean
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Machine Learning-Friendly Biomedical Datasets for Equivalence and Subsumption Ontology Matching | Zenodo
The purpose of these datasets is to support equivalence and subsumption ontology matching. There are five ontology pairs extracted from MONDO and UMLS: Source Ontology Pair Category MONDO OMIM-ORDO Disease MONDO NCIT-DOID Disease UMLS SNOMED-FMA Body UMLS SNOMED-NCIT Pharm UMLS SNOMED-NCIT Neoplas Each pair is associated with three folders: "raw_data", "equiv_match", and "subs_match", corresponding to the downloaded source ontologies, the package for equivalence matching, and the package for subsumption matching. See detailed documentation at: https://krr-oxford.github.io/DeepOnto/#/om_resources. See the incoming OAEI Bio-ML track at: https://www.cs.ox.ac.uk/isg/projects/ConCur/oaei/. See our resource paper at: https://arxiv.org/abs/2205.03447.
2 лет назад , @hangdong
dataset
iswc
machine_learning
myown
oaei
om
ontology
ontology_matching
datasetiswcmachine_learningmyownoaeiomontologyontology_matching
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Dataset Search: metadata for datasets | Kaggle
Datasets with DOIs and compact identifiers
2 лет назад , @jaeschke
data
dataset
doi
google
kaggle
research
search
unknowndata
datadatasetdoigooglekaggleresearchsearchunknowndata
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Veracity of schema.org for datasets (labeled data) | Kaggle
Dataset or Not? A study on the veracity of semantic markup for dataset pages.
2 лет назад , @jaeschke
data
dataset
google
kaggle
research
schema.org
unknowndata
datadatasetgooglekaggleresearchschema.orgunknowndata
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Single Cell Perturbation Dataset Explorer
https://www.scperturb.org/
2 лет назад , @becker
atac
cell
dataset
datasets
perturbation
seq
single
ataccelldatasetdatasetsperturbationseqsingle
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1TREC Washington Post Corpus
https://trec.nist.gov/data/wapost/
2 лет назад , @jaeschke
corpus
dataset
newspaper
text
trec
corpusdatasetnewspapertexttrec
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
2Archive Team: The Twitter Stream Grab : Free Web : Free Download, Borrow and Streaming : Internet Archive
https://archive.org/details/twitterstream
2 лет назад , @jaeschke
archive
data
dataset
sample
stream
twitter
archivedatadatasetsamplestreamtwitter
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1GitHub - earthspecies/beans: BEANS: The Benchmark of Animal Sounds
https://github.com/earthspecies/beans
2 лет назад , @topel
dataset
dataset
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1The Grid Audio-Visual Speech Corpus | Zenodo
The Grid Corpus is a large multitalker audiovisual sentence corpus designed to support joint computational-behavioral studies in speech perception. In brief, the corpus consists of high-quality audio and video (facial) recordings of 1000 sentences spoken by each of 34 talkers (18 male, 16 female), for a total of 34000 sentences. Sentences are of the form "put red at G9 now". audio_25k.zip contains the wav format utterances at a 25 kHz sampling rate in a separate directory per talker alignments.zip provides word-level time alignments, again separated by talker s1.zip, s2.zip etc contain .jpg videos for each talker [note that due to an oversight, no video for talker t21 is available] The Grid Corpus is described in detail in the paper jasagrid.pdf included in the dataset.
год назад , @topel
dataset
dataset
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1MIT Flickr Audio Caption Corpus
https://groups.csail.mit.edu/sls/downloads/flickraudio/
год назад , @topel
dataset
dataset
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Unknown Data | Mining and consolidating research dataset metadata on the Web
https://unknowndataproject.github.io/
год назад , @astrupp
crawl
data
dataset
datasets
web
crawldatadatasetdatasetsweb
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1ClimateBench | Zenodo
https://zenodo.org/record/7064308
год назад , @annakrause
benchmark
climate
dataset
machinelearning
benchmarkclimatedatasetmachinelearning
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Chelsa Climate – Climatologies at high resolution for the earth’s land surface areas
https://chelsa-climate.org/
10 месяцев назад , @annakrause
climate
dataset
free
highresolution
climatedatasetfreehighresolution
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1An annotated human blastocyst dataset to benchmark deep learning architectures for in vitro fertilization | Scientific Data
https://www.nature.com/articles/s41597-023-02182-3
6 месяцев назад , @scch
annotated
architecture
benchmark
dataset
deep-learning
human
annotatedarchitecturebenchmarkdatasetdeep-learninghuman
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Annual Article Processing Charges (APCs) and number of gold and hybrid open access articles in Web of Science indexed journals published by Elsevier, Sage, Springer-Nature, Taylor & Francis and Wiley 2015-2018
https://zenodo.org/records/7086420
3 месяцев назад , @jaeschke
academic
access
apc
dataset
oa
open
publishing
research
scholarly
academicaccessapcdatasetoaopenpublishingresearchscholarly
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Présentation – Corpus d'Etude pour le Français Contemporain (CEFC)
https://repository.ortolang.fr/api/content/cefc-orfeo/4/documentation/site-orfeo/home/index.html
3 месяцев назад , @topel
dataset
speech
datasetspeech
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1DailyDialog is a high-quality multi-turn open-domain English dialog dataset
https://paperswithcode.com/dataset/dailydialog
3 месяцев назад , @topel
dataset
dataset
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи

&lang;&lang;
⟨
1
2
3
&rang;
⟩⟩

публикации (спрятать)412
показать
всё
только публикации
публикации на страницу
5
10
20
50
100
расширенный...
RSS
BibTeX
RDF
дальше...

2Twitter's pulse on hydrogen energy in 280 characters: a data perspective.
D. Uniyal, и R. Nayak. Soc. Netw. Anal. Min., 14 (1): 37 (декабря 2024)
18 дней назад , @pfcdgayo
dataset
discourse
multilingual
twitter
datasetdiscoursemultilingualtwitter
(0)
копироватьудалитьдобавить публикацию в буфер
1SuperTweetEval: A Challenging, Unified and Heterogeneous Benchmark for Social Media NLP Research
D. Antypas, A. Ushio, F. Barbieri, L. Neves, K. Rezaee, L. Espinosa-Anke, J. Pei, и J. Camacho-Collados. (2023)
18 дней назад , @pfcdgayo
NLP
dataset
social-media
NLPdatasetsocial-media
(0)
копироватьудалитьдобавить публикацию в буфер
1Political DEBATE: Efficient Zero-shot and Few-shot Classifiers for Political Text
M. Burnham, K. Kahn, R. Wang, и R. Peng. (2024)
17 дней назад , @pfcdgayo
classification
dataset
classificationdataset
(0)
копироватьудалитьдобавить публикацию в буфер
2EUvsDisinfo: A Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles
J. Leite, O. Razuvayevskaya, K. Bontcheva, и C. Scarton. (2024)
17 дней назад , @pfcdgayo
dataset
disinformation
datasetdisinformation
(0)
копироватьудалитьдобавить публикацию в буфер
2ElectionRumors2022: A Dataset of Election Rumors on Twitter During the 2022 US Midterms
J. Schafer, K. Duskin, S. Prochaska, M. Wack, A. Beers, L. Bozarth, T. Agajanian, M. Caulfield, E. Spiro, и K. Starbird. (2024)
16 дней назад , @pfcdgayo
SMA
dataset
disinformation
misinformation
twitter
SMAdatasetdisinformationmisinformationtwitter
(0)
копироватьудалитьдобавить публикацию в буфер
2Newswire: A Large-Scale Structured Database of a Century of Historical News
E. Silcock, A. Arora, L. D'Amico-Wong, и M. Dell. (2024)
16 дней назад , @pfcdgayo
dataset
news-media
datasetnews-media
(0)
копироватьудалитьдобавить публикацию в буфер
2ESG-FTSE: A corpus of news articles with ESG relevance labels and use cases
M. Pavlova, B. Casey, и M. Wang. (2024)
16 дней назад , @pfcdgayo
climate-change
corpora
dataset
climate-changecorporadataset
(0)
копироватьудалитьдобавить публикацию в буфер
1NonRandom Tweet Mortality and Data Access Restrictions: Compromising the Replication of Sensitive Twitter Studies
A. Küpfer. (2024)
16 дней назад , @pfcdgayo
dataset
twitter
datasettwitter
(0)
копироватьудалитьдобавить публикацию в буфер
1Meta-dominance analysis--A tool for the assessment of the quality of digital behavioural data
A. Schneck, и W. Przepiorka. Social Science Computer Review, (2023)
16 дней назад , @pfcdgayo
data-quality
dataset
digital-traces
data-qualitydatasetdigital-traces
(0)
копироватьудалитьдобавить публикацию в буфер
2FSD: A novel forged document dataset and baseline
A. Jaiswal, S. Singh, и S. Tripathy. 2023 14th International Conference on Computing Communication and Networking Technologies (ICCCNT), стр. 1-6. IEEE, (июля 2023)
14 дней назад , @ghagerer
computer-vision
dataset
forged-documents
computer-visiondatasetforged-documents
(0)
копироватьудалитьдобавить публикацию в буфер

&lang;&lang;
⟨
1
2
3
&rang;
⟩⟩

BibSonomy

закладки (спрятать)743
показать
всё
только закладки
закладки на страницу
5
10
20
50
100
RSS
BibTeX
XML

1TLC Trip Record Data - TLC

1Google AI Blog: KELM: Integrating Knowledge Graphs with Language Model Pre-training Corpora

1Whole-cell segmentation of tissue images with human-level performance using large-scale data annotation and deep learning | Nature Biotechnology

1Data | Copernicus Marine

1Machine Learning-Friendly Biomedical Datasets for Equivalence and Subsumption Ontology Matching | Zenodo

1Dataset Search: metadata for datasets | Kaggle

1Veracity of schema.org for datasets (labeled data) | Kaggle

1Single Cell Perturbation Dataset Explorer

1TREC Washington Post Corpus

2Archive Team: The Twitter Stream Grab : Free Web : Free Download, Borrow and Streaming : Internet Archive

1GitHub - earthspecies/beans: BEANS: The Benchmark of Animal Sounds

1The Grid Audio-Visual Speech Corpus | Zenodo

1MIT Flickr Audio Caption Corpus

1Unknown Data | Mining and consolidating research dataset metadata on the Web

1ClimateBench | Zenodo

1Chelsa Climate – Climatologies at high resolution for the earth’s land surface areas

1An annotated human blastocyst dataset to benchmark deep learning architectures for in vitro fertilization | Scientific Data

1Annual Article Processing Charges (APCs) and number of gold and hybrid open access articles in Web of Science indexed journals published by Elsevier, Sage, Springer-Nature, Taylor & Francis and Wiley 2015-2018

1Présentation – Corpus d'Etude pour le Français Contemporain (CEFC)

1DailyDialog is a high-quality multi-turn open-domain English dialog dataset

публикации (спрятать)412
показать
всё
только публикации
публикации на страницу
5
10
20
50
100
расширенный...
RSS
BibTeX
RDF
дальше...

2Twitter's pulse on hydrogen energy in 280 characters: a data perspective.

1SuperTweetEval: A Challenging, Unified and Heterogeneous Benchmark for Social Media NLP Research

1Political DEBATE: Efficient Zero-shot and Few-shot Classifiers for Political Text

2EUvsDisinfo: A Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles

2ElectionRumors2022: A Dataset of Election Rumors on Twitter During the 2022 US Midterms

2Newswire: A Large-Scale Structured Database of a Century of Historical News

2ESG-FTSE: A corpus of news articles with ESG relevance labels and use cases

1NonRandom Tweet Mortality and Data Access Restrictions: Compromising the Replication of Sensitive Twitter Studies

1Meta-dominance analysis--A tool for the assessment of the quality of digital behavioural data

2FSD: A novel forged document dataset and baseline

просмотр

сходные по теме тэги

сходные по популярности тэги

закладки (спрятать)743 показатьвсётолько закладкизакладки на страницу5102050100 RSSBibTeXXML

публикации (спрятать)412 показатьвсётолько публикациипубликации на страницу5102050100 расширенный... RSSBibTeXRDFдальше...

просмотр

сходные по теме тэги

сходные по популярности тэги

закладки (спрятать)743
показать
всё
только закладки
закладки на страницу
5
10
20
50
100
RSS
BibTeX
XML

публикации (спрятать)412
показать
всё
только публикации
публикации на страницу
5
10
20
50
100
расширенный...
RSS
BibTeX
RDF
дальше...