bartowski/Meta-Llama-3.1-70B-Instruct-GGUF-torrent

Last updated on Jul 29, 2024

Filename	Quant type	File Size	Split	Description
Meta-Llama-3.1-70B-Instruct-Q8_0.gguf	Q8_0	74.98GB	true	Extremely high quality, generally unneeded but max available quant.
Meta-Llama-3.1-70B-Instruct-Q6_K_L.gguf	Q6_K_L	58.40GB	true	Uses Q8_0 for embed and output weights. Very high quality, near perfect, recommended.
Meta-Llama-3.1-70B-Instruct-Q6_K.gguf	Q6_K	57.89GB	true	Very high quality, near perfect, recommended.
Meta-Llama-3.1-70B-Instruct-Q5_K_L.gguf	Q5_K_L	50.60GB	true	Uses Q8_0 for embed and output weights. High quality, recommended.
Meta-Llama-3.1-70B-Instruct-Q5_K_M.gguf	Q5_K_M	49.95GB	true	High quality, recommended.
Meta-Llama-3.1-70B-Instruct-Q4_K_L.gguf	Q4_K_L	43.30GB	false	Uses Q8_0 for embed and output weights. Good quality, recommended.
Meta-Llama-3.1-70B-Instruct-Q4_K_M.gguf	Q4_K_M	42.52GB	false	Good quality, default size for must use cases, recommended.
Meta-Llama-3.1-70B-Instruct-IQ4_XS.gguf	IQ4_XS	37.90GB	false	Decent quality, smaller than Q4_K_S with similar performance, recommended.
Meta-Llama-3.1-70B-Instruct-Q5_K_S.gguf	Q5_K_S	36.13GB	false	High quality, recommended.
Meta-Llama-3.1-70B-Instruct-IQ3_M.gguf	IQ3_M	31.94GB	false	Medium-low quality, new method with decent performance comparable to Q3_K_M.
Meta-Llama-3.1-70B-Instruct-Q3_K_S.gguf	Q3_K_S	30.91GB	false	Low quality, not recommended.
Meta-Llama-3.1-70B-Instruct-IQ3_XS.gguf	IQ3_XS	29.31GB	false	Lower quality, new method with decent performance, slightly better than Q3_K_S.
Meta-Llama-3.1-70B-Instruct-Q2_K_L.gguf	Q2_K_L	27.40GB	false	Uses Q8_0 for embed and output weights. Very low quality but surprisingly usable.
Meta-Llama-3.1-70B-Instruct-Q2_K.gguf	Q2_K	26.38GB	false	Very low quality but surprisingly usable.
Meta-Llama-3.1-70B-Instruct-IQ2_M.gguf	IQ2_M	24.12GB	false	Relatively low quality, uses SOTA techniques to be surprisingly usable.