на 8гб врм + 16 рам 9б со 128к контекстом пыжится над квантовым симуляторо) по ощущениям где-то 8-10 токенов в секунду... ну еще и контекст пока не сильно забит