Pretrained Transformers As Universal Computation Engines (2021) by optimalsolver

0CommentsShare PostShare on Facebook Share on XShare by EmailSend Link

News

Pretrained Transformers As Universal Computation Engines (2021) by optimalsolver

ByHackTech May 13, 2022

0Comments

Share This Article

Sed ut perspiciatis unde.

Send to HN

[Submitted on 9 Mar 2021 (v1), last revised 30 Jun 2021 (this version, v2)]

Download PDF

Abstract: We investigate the capability of a transformer pretrained on natural language
to generalize to other modalities with minimal finetuning — in particular,
without finetuning of the self-attention and feedforward layers of the residual
blocks. We co

Tags: Pretrained Transformers

0Likes

Written by

HackTech

View all posts by HackTech

Pretrained Transformers As Universal Computation Engines (2021) by optimalsolver

Pretrained Transformers As Universal Computation Engines (2021) by optimalsolver

Share This Article

Newsletter

HackTech

Leave a comment Cancel reply

Editor's Choice

Pretrained Transformers As Universal Computation Engines (2021) by optimalsolver

Pretrained Transformers As Universal Computation Engines (2021) by optimalsolver

Share This Article

Newsletter

HackTech

Leave a comment Cancel reply

Editor's Choice

Sign Up to Our Newsletter