tag :: transformer | BibSonomy

закладки (спрятать)32
показать
всё
только закладки
закладки на страницу
5
10
20
50
100
RSS
BibTeX
XML

1Mamba Explained | Kola Ayonrinde
https://www.kolaayonrinde.com/blog/2024/02/11/mamba.html
7 месяцев назад , @bshanks
llm
mamba
ssm
transformer
llmmambassmtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1atmorep.org
https://www.atmorep.org/#presentations
11 месяцев назад , @annakrause
atmorep
climate
deeplearning
idea:remoformer
transformer
atmorepclimatedeeplearningidea:remoformertransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time.
https://jalammar.github.io/illustrated-transformer/
год назад , @bsc
neural-networks
transformer
neural-networkstransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
3Google "We Have No Moat, And Neither Does OpenAI"
https://www.semianalysis.com/p/google-we-have-no-moat-and-neither
год назад , @annakrause
llm
training
transformer
llmtrainingtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1SuperGLUE Benchmark
SuperGLUE is a new benchmark styled after original GLUE benchmark with a set of more difficult language understanding tasks, improved resources, and a new public leaderboard..
год назад , @annakrause
idea:bee_audio_llm
idea:big_data_geo_2
superglue
transformer
idea:bee_audio_llmidea:big_data_geo_2supergluetransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
2Just A Drop In The Bucket
https://milk.com/wall-o-shame/bucket.html
год назад , @bshanks
restaurant
transformer
restauranttransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1NeurIPS_ML4PS_2022_28.pdf
https://ml4physicalsciences.github.io/2022/files/NeurIPS_ML4PS_2022_28.pdf
год назад , @annakrause
climate
idea:big_data_geo_2
todo:read
transformer
climateidea:big_data_geo_2todo:readtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Transformers, Explained: Understand the Model Behind GPT-3, BERT, and T5
A quick intro to Transformers, a new neural network transforming SOTA in machine learning.
2 лет назад , @analyst
article
blog
deep-learning
transformer
articleblogdeep-learningtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Researchers Glimpse How AI Gets So Good at Language Processing | Quanta Magazine
https://www.quantamagazine.org/researchers-glimpse-how-ai-gets-so-good-at-language-processing-20220414/
2 лет назад , @bshanks
attention
neuralnet
toread+
transformer
variable
attentionneuralnettoread+transformervariable
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Facebook & UC Berkeley Substitute a Convolutional Stem to Dramatically Boost Vision Transformers’ Optimization Stability | Synced
Recent studies have shown that vision transformer (ViT) models can attain better results than most state-of-the-art convolutional neural networks (CNNs) across various image recognition tasks, and can do so while using considerably fewer computational resources. This has led some researchers to propose ViTs could replace CNNs in this field.However, despite their promising performance, ViTs areContinue Reading
3 лет назад , @analyst
article
blog
computer-vision
machine-learning
transformer
articleblogcomputer-visionmachine-learningtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Is attention what you really need in Transformers? | by Davide Coccomini | Jun, 2021 | Towards Data Science
In recent years there has been an explosion of methods based on self-attention and in particular Transformers, first in the field of Natural Language Processing and recently also in the field of…
3 лет назад , @analyst
article
blog
transformer
articleblogtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Instructions on Transformer for people outside NLP field, but with examples of NLP – Data Science Blog
https://data-science-blog.com/blog/2020/12/30/transformer/
3 лет назад , @analyst
2020
article
blog
deep-learning
transformer
tutorial
2020articleblogdeep-learningtransformertutorial
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1End-to-End Video Instance Segmentation With Transformers
https://openaccess.thecvf.com/content/CVPR2021/html/Wang_End-to-End_Video_Instance_Segmentation_With_Transformers_CVPR_2021_paper.html
3 лет назад , @shuncheng.wu
cvpr21
deeplearning
instance_segmentation
transformer
video
cvpr21deeplearninginstance_segmentationtransformervideo
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1MaX-DeepLab: End-to-End Panoptic Segmentation With Mask Transformers
https://openaccess.thecvf.com/content/CVPR2021/papers/Wang_MaX-DeepLab_End-to-End_Panoptic_Segmentation_With_Mask_Transformers_CVPR_2021_paper.pdf
3 лет назад , @shuncheng.wu
cvpr21
deeplearning
instance
panoptic
segmentation
transformer
cvpr21deeplearninginstancepanopticsegmentationtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Google Replaces BERT Self-Attention with Fourier Transform: 92% Accuracy, 7 Times Faster on GPUs | Synced
https://syncedreview.com/2021/05/14/deepmind-podracer-tpu-based-rl-frameworks-deliver-exceptional-performance-at-low-cost-19/amp/
3 лет назад , @annakrause
BERT
GPU
transformer
BERTGPUtransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1A Visual Guide to Using BERT for the First Time – Jay Alammar – Visualizing machine learning one concept at a time.
https://jalammar.github.io/a-visual-guide-to-using-bert-for-the-first-time/
4 лет назад , @becker
bert
visual
guide
example
neural
network
natural
language
processing
nlp
transformer
bertvisualguideexampleneuralnetworknaturallanguageprocessingnlptransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1deepset-ai/FARM: Fast & easy transfer learning for NLP. Harvesting language models for the industry.
:house_with_garden: Fast & easy transfer learning for NLP. Harvesting language models for the industry. - deepset-ai/FARM
4 лет назад , @nosebrain
farm
library
nlp
transformer
farmlibrarynlptransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Text Synth
https://bellard.org/textsynth/
4 лет назад , @hotho
gpt2
model
talk
test
transformer
gpt2modeltalktesttransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Write With Transformer
See how a modern neural network auto-completes your text
5 лет назад , @nosebrain
demo
gpt2
text
transformer
write
demogpt2texttransformerwrite
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи
1Transformers are Graph Neural Networks | NTU Graph Deep Learning Lab
Engineer friends often ask me: Graph Deep Learning sounds great, but are there any big commercial success stories? Is it being deployed in practical applications? Besides the obvious ones–recommendation systems at Pinterest, Alibaba and Twitter–a slightly nuanced success story is the Transformer architecture, which has taken the NLP industry by storm. Through this post, I want to establish links between Graph Neural Networks (GNNs) and Transformers. I’ll talk about the intuitions behind model architectures in the NLP and GNN communities, make connections using equations and figures, and discuss how we could work together to drive progress.
5 лет назад , @hotho
deep
graph
learning
network
neural
nn
transformer
deepgraphlearningnetworkneuralnntransformer
(0)
копироватьудалить
- Запись сообщества
- посмотреть историю записи

&lang;&lang;
⟨
1
2
&rang;
⟩⟩

публикации (спрятать)200
показать
всё
только публикации
публикации на страницу
5
10
20
50
100
расширенный...
RSS
BibTeX
RDF
дальше...

2Survey and Taxonomy: The Role of Data-Centric AI in Transformer-Based Time Series Forecasting
J. Xu, C. Wu, Y. Li, G. Danoy, и P. Bouvry. (2024)
2 месяцев назад , @okometaberu
time-series
transformer
time-seriestransformer
(0)
копироватьудалитьдобавить публикацию в буфер
2MoEUT: Mixture-of-Experts Universal Transformers
R. Csordás, K. Irie, J. Schmidhuber, C. Potts, и C. Manning. (2024)
4 месяцев назад , @tobias.koopmann
adapter
reading
transformer
adapterreadingtransformer
(0)
копироватьудалитьдобавить публикацию в буфер
1Expert system for improving and controlling insulation system of service transformers using fuzzy logic controller
D. Madumere, E. Ashigwuike, и N. Gafai. Global Journal of Engineering and Technology Advances, 18 (3): 066–074 (апреля 2024)
6 месяцев назад , @gjetajournal
Acidicity
Oil
Transformer
AcidicityOilTransformer
(0)
копироватьудалитьдобавить публикацию в буфер
1再帰型ニューラルネットワークを用いた花粉飛散量予測
石崎修良. 卒業論文抄録, 東京理科大学経営学部, (2024)
7 месяцев назад , @andolab
Transformer
卒論抄録再帰型ニューラルネットワーク
時系列データ
Transformer卒論抄録再帰型ニューラルネットワーク時系列データ
(0)
копироватьудалитьдобавить публикацию в буфер
3MANDO-HGT: Heterogeneous Graph Transformers for Smart Contract Vulnerability Detection
H. Nguyen, N. Nguyen, C. Xie, Z. Ahmadi, D. Kudendo, T. Doan, и L. Jiang. 2023 IEEE/ACM 20th International Conference on Mining Software Repositories (MSR), стр. 334-346. (мая 2023)
7 месяцев назад , @erichoang
bytecode
code
contracts
detection
graph
heterogeneous
learning
myown
smart
source
transformer
vulnerability
bytecodecodecontractsdetectiongraphheterogeneouslearningmyownsmartsourcetransformervulnerability
(0)
копироватьудалитьдобавить публикацию в буфер
3MANDO-HGT: Heterogeneous Graph Transformers for Smart Contract Vulnerability Detection
H. Nguyen, N. Nguyen, C. Xie, Z. Ahmadi, D. Kudendo, T. Doan, и L. Jiang. 2023 IEEE/ACM 20th International Conference on Mining Software Repositories (MSR), стр. 334-346. (мая 2023)
7 месяцев назад , @l3s
bytecode
myown
code
detection
from:erichoang
learning
transformer
source
heterogeneous
vulnerability
contracts
graph
smart
bytecodemyowncodedetectionfrom:erichoanglearningtransformersourceheterogeneousvulnerabilitycontractsgraphsmart
(0)
копироватьудалитьдобавить публикацию в буфер
3ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks
J. Lu, D. Batra, D. Parikh, и S. Lee. Advances in Neural Information Processing Systems, 32, Curran Associates, Inc., (2019)
8 месяцев назад , @annakrause
climate
idea:remoformer
pretraining
transformer
climateidea:remoformerpretrainingtransformer
(0)
копироватьудалитьдобавить публикацию в буфер
3An Attention Free Transformer
S. Zhai, W. Talbott, N. Srivastava, C. Huang, H. Goh, R. Zhang, и J. Susskind. (2021)
8 месяцев назад , @andolab
Attention
Transformer
AttentionTransformer
(0)
копироватьудалитьдобавить публикацию в буфер
2GMAN: A Graph Multi-Attention Network for Traffic Prediction
C. Zheng, X. Fan, C. Wang, и J. Qi. Proceedings of the AAAI Conference on Artificial Intelligence, 34, стр. 1234-1241. (апреля 2020)
9 месяцев назад , @andolab
traffic-flow
transformer
traffic-flowtransformer
(0)
копироватьудалитьдобавить публикацию в буфер
1Bidirectional Spatial-Temporal Adaptive Transformer for Urban Traffic Flow Forecasting
C. Chen, Y. Liu, L. Chen, и C. Zhang. IEEE Transactions on Neural Networks and Learning Systems, (2022)
9 месяцев назад , @andolab
spatio-temporal
transformer
spatio-temporaltransformer
(0)
копироватьудалитьдобавить публикацию в буфер
32Attention Is All You Need
A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. Gomez, L. Kaiser, и I. Polosukhin. (2017)
9 месяцев назад , @chiir_demo
languagemodel
neural-machine-translation
nlp
to_read
transformer
languagemodelneural-machine-translationnlpto_readtransformer
(1)
копироватьудалитьдобавить публикацию в буфер
2HyperMixer: An MLP-based Low Cost Alternative to Transformers
F. Mai, A. Pannatier, F. Fehr, H. Chen, F. Marelli, F. Fleuret, и J. Henderson. (2023)
9 месяцев назад , @annakrause
idea:big_data_geo_2
idea:remoformer
readinggroup
transformer
idea:big_data_geo_2idea:remoformerreadinggrouptransformer
(0)
копироватьудалитьдобавить публикацию в буфер
19BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
J. Devlin, M. Chang, K. Lee, и K. Toutanova. (2018)cite arxiv:1810.04805.
10 месяцев назад , @annakrause
bert
todo:read
transformer
berttodo:readtransformer
(1)
копироватьудалитьдобавить публикацию в буфер
1Compositional Zero-Shot Domain Transfer with Text-to-Text Models
F. Liu, Q. Liu, S. Bannur, F. Pérez-García, N. Usuyama, S. Zhang, T. Naumann, A. Nori, H. Poon, J. Alvarez-Valle и 2 other автор(ы). Transactions of the Association for Computational Linguistics, (сентября 2023)
10 месяцев назад , @antonvlasjuk
low-resource-domains
multitask
nlp
transformer
low-resource-domainsmultitasknlptransformer
(0)
копироватьудалитьдобавить публикацию в буфер
2FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead
K. Chen, T. Han, J. Gong, L. Bai, F. Ling, J. Luo, X. Chen, L. Ma, T. Zhang, R. Su и 4 other автор(ы). (2023)cite arxiv:2304.02948Comment: 12 pages.
10 месяцев назад , @annakrause
climate
deeplearning
idea:big_data_geo_2
idea:remoformer
todo:read
transformer
weather
climatedeeplearningidea:big_data_geo_2idea:remoformertodo:readtransformerweather
(0)
копироватьудалитьдобавить публикацию в буфер
5ClimaX: A foundation model for weather and climate
T. Nguyen, J. Brandstetter, A. Kapoor, J. Gupta, и A. Grover. (2023)cite arxiv:2301.10343Comment: International Conference on Machine Learning 2023.
10 месяцев назад , @annakrause
climate
deeplearning
idea:big_data_geo_2
transformer
climatedeeplearningidea:big_data_geo_2transformer
(0)
копироватьудалитьдобавить публикацию в буфер
1Multimodal Learning with Transformers: A Survey
P. Xu, X. Zhu, и D. Clifton. (2022)cite arxiv:2206.06488Comment: This paper is accepted by IEEE TPAMI.
11 месяцев назад , @annakrause
todo:read
training
transformer
todo:readtrainingtransformer
(0)
копироватьудалитьдобавить публикацию в буфер
1SiT: Self-supervised vIsion Transformer
S. Atito, M. Awais, и J. Kittler. (2021)cite arxiv:2104.03602.
11 месяцев назад , @annakrause
selfsupervised
todo:read
training
transformer
vit
selfsupervisedtodo:readtrainingtransformervit
(0)
копироватьудалитьдобавить публикацию в буфер
3GPT-4 Technical Report
OpenAI. ArXiv, (2023)
11 месяцев назад , @tomvoelker
gpt-4
openai
transformer
multimodal
bar_exam
alignment_process
paper_demo
posted_with_chatgpt
gpt-4openaitransformermultimodalbar_examalignment_processpaper_demoposted_with_chatgpt
(0)
копироватьудалитьдобавить публикацию в буфер
2End-to-end Symbolic Regression with Transformers
P. Kamienny, S. d'Ascoli, G. Lample, и F. Charton. Advances in Neural Information Processing Systems, (2022)
11 месяцев назад , @adulny
ak-symbolic-numeric
deep-learning
from:adulny
reading-done
symbolic
symbolic-regression
transformer
ak-symbolic-numericdeep-learningfrom:adulnyreading-donesymbolicsymbolic-regressiontransformer
(0)
копироватьудалитьдобавить публикацию в буфер

&lang;&lang;
⟨
1
2
3
&rang;
⟩⟩

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter