Salud!
En principio, solo necesitas una interfaz un tanto curiosa (= no muy mala) y un micro de cuya calidad, por supuesto, dependerá cómo suenen las voces.
Monitores no te hacen falta, realmente. Todo el mundo dice que lo importante no es que los tuyos sean buenos, sino que los conozcas bien y sepas cómo colorean el sonido. Y esa filosofía, correcta como es, me llevó a vender mis monitores, que tampoco eran muy buenos, y mezclar con los altavoces multimedia.
Lo de grabar el bajo es algo jodido. Yo uso una tarjeta curiosa en el nivel del homestudio, una MotU Ultralite, y nunca me ha gustado cómo queda el bajo. Muchas veces he pensado en pillar un previo solo para eso, pero cuando tenía uno a tiro no tenía el dinero. El mejor resultado lo conseguía grabando desde la salida de grabación del cabezal. Hace poco probé un Zoom B3 como interfaz de audio y... CLAC. Suena exactamente como quiero que suene. Es decir, lo que sale por los altavoces es lo que se graba, no echo en falta nada y todo lo que pasa es culpa mía.
Pero, en teoría, con enchufar el bajo a la entrada (la de Instrument o High Z, de haberla), ya te vale.
Mezclador... Lo mejor es meter cuantas menos cosas mejor. Todo mete ruido, en mayor o menor medida. Un mezclador te permite... eso, mezclar, meter más cosas a la vez, como CDs, un iPad con instrumentos, voces... Y te da más posibilidades de ruteo.
Mi tarjeta tiene 2 entradas con previo y 6 más de línea, así que, básicamente, la uso de mezclador. Las tarjetas con menos entradas no tienen esta capacidad, claro.