5 5 161

TheFireHacker PRO

TheFireHacker

https://aiedx.com

AI & ML interests

LLM, sub quadraric attention, AI Agents , Synthetic Data

Recent Activity

liked a model 7 days ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

liked a dataset 24 days ago

cais/mmlu

liked a model about 1 month ago

Qwen/Qwen3.5-0.8B

View all activity

Organizations

liked a model 7 days ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated 1 day ago • 1.47M • 246

liked a dataset 24 days ago

cais/mmlu

Viewer • Updated Mar 8, 2024 • 231k • 401k • 695

liked 2 models about 1 month ago

Qwen/Qwen3.5-0.8B

Image-Text-to-Text • 0.9B • Updated Mar 2 • 2.05M • 469

SakanaAI/doc-to-lora

Updated Feb 12 • 15

liked a model about 2 months ago

HuggingFaceTB/SmolLM3-3B

Text Generation • 3B • Updated Sep 10, 2025 • 1.09M • 925

liked a Space about 2 months ago

Evaluation Guidebook

📝

299

Explore LLM benchmark trends over time

liked a dataset 2 months ago

kjj0/fineweb10B-gpt2

Updated Sep 28, 2024 • 3.62k • 10

liked a model 2 months ago

arcee-ai/Trinity-Large-Base

Text Generation • 399B • Updated 2 days ago • 282 • 54

liked a dataset 2 months ago

MathLLMs/MathVision

Viewer • Updated Nov 27, 2025 • 3.34k • 19.5k • 133

liked 2 models 2 months ago

moonshotai/Kimi-VL-A3B-Instruct

Image-Text-to-Text • 16B • Updated Jan 30 • 289k • 258

moonshotai/Kimi-K2.5

Image-Text-to-Text • 1.1T • Updated Feb 27 • 6.19M • • 2.41k

liked a model 4 months ago

bubblspace/Timecapsule2.7B-g3n-mix-match

Image-Text-to-Text • 7B • Updated Aug 6, 2025 • 5 • 1

upvoted an article 4 months ago

Article

Activation Steering With Mean Response Probes : A Case Study In Suppressing Sycophancy In Language Models During TTC

Nov 27, 2025

•

liked a model 4 months ago

PleIAs/Monad

Text Generation • 56.7M • Updated Dec 14, 2025 • 2.78k • 68

liked a dataset 4 months ago

PleIAs/SYNTH

Viewer • Updated Nov 11, 2025 • 68M • 63.7k • 260

liked a model 5 months ago

Xenova/bge-small-en-v1.5

Feature Extraction • Updated Jul 22, 2025 • 133k • 14

New activity in bubblspace/Bubbl-P4-multimodal-instruct 7 months ago

TypeError: Phi4MMAudioFeatureExtractor.init() missing 3 required positional arguments: 'audio_compression_rate', 'audio_downsample_rate', and 'audio_feat_stride'

👍 1

#1 opened 9 months ago by

yagizdaskiran

upvoted a paper 7 months ago

SFR-DeepResearch: Towards Effective Reinforcement Learning for Autonomously Reasoning Single Agents

Paper • 2509.06283 • Published Sep 8, 2025 • 17

liked a model 7 months ago

TheFireHacker/Qwen3-0.6b-TensorSlayerPatch

0.6B • Updated Sep 8, 2025 • 7 • 1

New activity in TheFireHacker/Qwen3-0.6b-TensorSlayerPatch 7 months ago

Semantic Relationship: Q4 Quantized model is broken Moving towards AWQ Q4_K_M model

#1 opened 7 months ago by