Смотрим на кэш процессора при умножении матриц

Разбираемся, почему транспонирование матрицы может ускорить умножение и почему деление алгоритма на потоки может работать медленнее, чем однопоточная версия. Используем cachegrind, чтобы посмотреть на поведение кэша.
Back to Top