void multiply_matrices(float a[9], float b[9], float out[9]);