О, ты пишешь CUDA-ядра?

Все уже давно на Triton. Шучу, мы все на Mojo. Мы используем cuTile. Мы используем ROCm. У нас внутренний DSL-компилятор, для NVGPU MLIR dialect, но, только что вышел Tile IR, так что теперь мы будем
использовать его. Наш PM сидит на TileLang. Тимлид была на CuTe, но теперь она снова пишет PTX вручную. Наш интерн строит на TT-Metalium для наших Wormhole’ов. Наш CFO одобрил заказ на здоровенные wafer-scale чипы, так что теперь мы портируем наши ядра на CSL. Наш CTO работает над kernel-less graph compiler’ом, так что скоро нам вообще не нужно будет писать ядра. Наш CEO думает, что мы говорим про ядро Linux. Кстати мы делаем Cursor для собак.​​​​​​​​​​​​​​​​