Generative Pre-trained Transformer

From wikieduonline

Revision as of 15:20, 24 August 2023 by Welcome (talk | contribs) (→‎Related)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Jump to navigation Jump to search

wikipedia:Generative Pre-trained Transformer

GPT-4 (Mar 2023)
GPT-3 (Jun 2020, beta) the architecture is a decoder-only transformer network with a 2048-token-long context and 175 billion parameters, requiring 800GB to store.
GPT-2 (Feb 2019)

Related

See also

Transformer, GPT, Transformer 8, Ethched, Megatron-Core
GPT, GPT-2, GPT-3, GPT-4, GPT-4o, Tiktoken, Bigram, Transformer, PaLM, ChatGPT

Retrieved from "https://www.wikieduonline.com/index.php?title=Generative_Pre-trained_Transformer&oldid=260354"

GPT

Advertising: