JaphetHernandez commited on
Commit
dc80529
verified
1 Parent(s): 26aca0d

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +3 -3
app.py CHANGED
@@ -14,9 +14,9 @@ huggingface_token = st.secrets["FIREWORKS"]
14
  login(huggingface_token)
15
 
16
  # Configurar modelo Fireworks con cuantizaci贸n int8
17
- quant_config = BitsAndBytesConfig.from_model_type(
18
- "int8", # Cuantizaci贸n para reducir el tama帽o y acelerar
19
- quantization_scheme="gptq"
20
  )
21
 
22
  model_id = "fireworks-ai/firefunction-v2"
 
14
  login(huggingface_token)
15
 
16
  # Configurar modelo Fireworks con cuantizaci贸n int8
17
+ quant_config = BitsAndBytesConfig(
18
+ load_in_8bit=True, # Activar la carga en int8
19
+ quantization_scheme="gptq" # Especificar el esquema GPTQ
20
  )
21
 
22
  model_id = "fireworks-ai/firefunction-v2"