_format_classifier_8cpp_source.html

/**********************************************************************


  Audacity: A Digital Audio Editor


  FormatClassifier.cpp


  Philipp Sibler


******************************************************************//*******************************************************************/

#include "FormatClassifier.h"


#include <stdint.h>

#include <cmath>

#include <cfloat>

#include <vector>


#include <wx/defs.h>


#include "sndfile.h"


FormatClassifier::FormatClassifier(const char* filename) :

   mReader(filename),

   mMeter(cSiglen)

{

   // Define the classification classes

   for ( auto endianness : {

      MachineEndianness::Little,

      MachineEndianness::Big,

   } )

      for ( auto format : {

         MultiFormatReader::Int8,

         MultiFormatReader::Int16,

         MultiFormatReader::Int32,

         MultiFormatReader::Uint8,

         MultiFormatReader::Float,

         MultiFormatReader::Double,

      } )

         mClasses.push_back( { format, endianness } );


   // Build feature vectors

   mMonoFeat = Floats{ mClasses.size() };

   mStereoFeat = Floats{ mClasses.size() };


#ifdef FORMATCLASSIFIER_SIGNAL_DEBUG

   // Build a debug writer

   char dfile [1024];

   sprintf(dfile, "%s.sig", filename);

   mpWriter = std::make_unique<DebugWriter>(dfile);

#endif


   // Run it

   Run();


#ifdef FORMATCLASSIFIER_SIGNAL_DEBUG

   for (unsigned int n = 0; n < mClasses.size(); n++)

   {

      wxPrintf("Class [%i] Machine [%i]: Mono: %3.7f Stereo: %3.7f\n", mClasses[n].format, mClasses[n].endian, mMonoFeat[n], mStereoFeat[n]);

   }

#endif


}


FormatClassifier::~FormatClassifier()

{

}


FormatClassifier::FormatClassT FormatClassifier::GetResultFormat()

{

   return mResultFormat;

}


int FormatClassifier::GetResultFormatLibSndfile()

{

   int format = SF_FORMAT_RAW;


   switch(mResultFormat.format)

   {

      case MultiFormatReader::Int8:

         format |= SF_FORMAT_PCM_S8;

         break;

      case MultiFormatReader::Int16:

         format |= SF_FORMAT_PCM_16;

         break;

      case MultiFormatReader::Int32:

         format |= SF_FORMAT_PCM_32;

         break;

      case MultiFormatReader::Uint8:

         format |= SF_FORMAT_PCM_U8;

         break;

      case MultiFormatReader::Float:

         format |= SF_FORMAT_FLOAT;

         break;

      case MultiFormatReader::Double:

         format |= SF_FORMAT_DOUBLE;

         break;

      default:

         format |= SF_FORMAT_PCM_16;

         break;

   }


   switch(mResultFormat.endian)

   {

      case MachineEndianness::Little:

         format |= SF_ENDIAN_LITTLE;

         break;

      case MachineEndianness::Big:

         format |= SF_ENDIAN_BIG;

         break;

   }


   return format;

}


unsigned FormatClassifier::GetResultChannels()

{

   return mResultChannels;

}


void FormatClassifier::Run()

{

   // Calc the mono feature vector

   for (unsigned int n = 0; n < mClasses.size(); n++)

   {

      // Read the signal

      ReadSignal(mClasses[n], 1);

#ifdef FORMATCLASSIFIER_SIGNAL_DEBUG

      mpWriter->WriteSignal(mSigBuffer, cSiglen);

#endif


      // Do some simple preprocessing

      // Remove DC offset

      float smean = Mean(mSigBuffer.get(), cSiglen);

      Sub(mSigBuffer.get(), smean, cSiglen);

      // Normalize to +- 1.0

      Abs(mSigBuffer.get(), mAuxBuffer.get(), cSiglen);

      float smax = Max(mAuxBuffer.get(), cSiglen);

      Div(mSigBuffer.get(), smax, cSiglen);


      // Now actually fill the feature vector

      // Low to high band power ratio

      float pLo = mMeter.CalcPower(mSigBuffer.get(), 0.15f, 0.3f);

      float pHi = mMeter.CalcPower(mSigBuffer.get(), 0.45f, 0.1f);

      mMonoFeat[n] = pLo / pHi;

   }


   // Calc the stereo feature vector

   for (unsigned int n = 0; n < mClasses.size(); n++)

   {

      // Read the signal

      ReadSignal(mClasses[n], 2);

#ifdef FORMATCLASSIFIER_SIGNAL_DEBUG

      mpWriter->WriteSignal(mSigBuffer, cSiglen);

#endif


      // Do some simple preprocessing

      // Remove DC offset

      float smean = Mean(mSigBuffer.get(), cSiglen);

      Sub(mSigBuffer.get(), smean, cSiglen);

      // Normalize to +- 1.0

      Abs(mSigBuffer.get(), mAuxBuffer.get(), cSiglen);

      float smax = Max(mAuxBuffer.get(), cSiglen);

      Div(mSigBuffer.get(), smax, cSiglen);


      // Now actually fill the feature vector

      // Low to high band power ratio

      float pLo = mMeter.CalcPower(mSigBuffer.get(), 0.15f, 0.3f);

      float pHi = mMeter.CalcPower(mSigBuffer.get(), 0.45f, 0.1f);

      mStereoFeat[n] = pLo / pHi;

   }


   // Get the results

   size_t midx, sidx;

   float monoMax = Max(mMonoFeat.get(), mClasses.size(), &midx);

   float stereoMax = Max(mStereoFeat.get(), mClasses.size(), &sidx);


   if (monoMax > stereoMax)

   {

      mResultChannels = 1;

      mResultFormat = mClasses[midx];

   }

   else

   {

      mResultChannels = 2;

      mResultFormat = mClasses[sidx];

   }


}


void FormatClassifier::ReadSignal(FormatClassT format, size_t stride)

{

   size_t actRead = 0;

   unsigned int n = 0;


   mReader.Reset();


   // Do a dummy read of 1024 bytes to skip potential header information

   mReader.ReadSamples(mRawBuffer.get(), 1024, MultiFormatReader::Uint8, MachineEndianness::Little);


   do

   {

      actRead = mReader.ReadSamples(mRawBuffer.get(), cSiglen, stride, format.format, format.endian);


      if (n == 0)

      {

         ConvertSamples(mRawBuffer.get(), mSigBuffer.get(), format);

      }

      else

      {

         if (actRead == cSiglen)

         {

            ConvertSamples(mRawBuffer.get(), mAuxBuffer.get(), format);


            // Integrate signals

            Add(mSigBuffer.get(), mAuxBuffer.get(), cSiglen);


            // Do some dummy reads to break signal coherence

            mReader.ReadSamples(mRawBuffer.get(), n + 1, stride, format.format, format.endian);

         }

      }


      n++;


   } while ((n < cNumInts) && (actRead == cSiglen));


}


void FormatClassifier::ConvertSamples(void* in, float* out, FormatClassT format)

{

   switch(format.format)

   {

      case MultiFormatReader::Int8:

         ToFloat((int8_t*) in, out, cSiglen);

         break;

      case MultiFormatReader::Int16:

         ToFloat((int16_t*) in, out, cSiglen);

         break;

      case MultiFormatReader::Int32:

         ToFloat((int32_t*) in, out, cSiglen);

         break;

      case MultiFormatReader::Uint8:

         ToFloat((uint8_t*) in, out, cSiglen);

         break;

      case MultiFormatReader::Uint16:

         ToFloat((uint16_t*) in, out, cSiglen);

         break;

      case MultiFormatReader::Uint32:

         ToFloat((uint32_t*) in, out, cSiglen);

        break;

      case MultiFormatReader::Float:

         ToFloat((float*) in, out, cSiglen);

         break;

      case MultiFormatReader::Double:

         ToFloat((double*) in, out, cSiglen);

         break;

   }

}


void FormatClassifier::Add(float* in1, float* in2, size_t len)

{

   for (unsigned int n = 0; n < len; n++)

   {

      in1[n] += in2[n];

   }

}


void FormatClassifier::Sub(float* in, float subt, size_t len)

{

   for (unsigned int n = 0; n < len; n++)

   {

      in[n] -= subt;

   }

}


void FormatClassifier::Div(float* in, float div, size_t len)

{

   for (unsigned int n = 0; n < len; n++)

   {

      in[n] /= div;

   }

}


void FormatClassifier::Abs(float* in, float* out, size_t len)

{

   for (unsigned int n = 0; n < len; n++)

   {

      if (in[n] < 0.0f)

      {

         out[n] = -in[n];

      }

      else

      {

         out[n] = in[n];

      }

   }

}


float FormatClassifier::Mean(float* in, size_t len)

{

   float mean = 0.0f;


   for (unsigned int n = 0; n < len; n++)

   {

      mean += in[n];

   }


   mean /= len;


   return mean;

}


float FormatClassifier::Max(float* in, size_t len)

{

   size_t dummyidx;

   return Max(in, len, &dummyidx);

}


float FormatClassifier::Max(float* in, size_t len, size_t* maxidx)

{

   float max = -FLT_MAX;

   *maxidx = 0;


   for (unsigned int n = 0; n < len; n++)

   {

      if (in[n] > max)

      {

         max = in[n];

         *maxidx = n;

      }

   }


   return max;

}


template<class T> void FormatClassifier::ToFloat(T* in, float* out, size_t len)

{

   for(unsigned int n = 0; n < len; n++)

   {

      out[n] = (float) in[n];

   }

}

FormatClassifier.h

ArrayOf< float >

FormatClassifier::~FormatClassifier
~FormatClassifier()
Definition: FormatClassifier.cpp:73

FormatClassifier::mAuxBuffer
Floats mAuxBuffer
Definition: FormatClassifier.h:83

FormatClassifier::mResultFormat
FormatClassT mResultFormat
Definition: FormatClassifier.h:89

FormatClassifier::ToFloat
void ToFloat(T *in, float *out, size_t len)
Definition: FormatClassifier.cpp:345

FormatClassifier::Abs
void Abs(float *in, float *out, size_t len)
Definition: FormatClassifier.cpp:293

FormatClassifier::mSigBuffer
Floats mSigBuffer
Definition: FormatClassifier.h:82

FormatClassifier::mReader
MultiFormatReader mReader
Definition: FormatClassifier.h:75

FormatClassifier::ConvertSamples
void ConvertSamples(void *in, float *out, FormatClassT format)
Definition: FormatClassifier.cpp:237

FormatClassifier::Sub
void Sub(float *in, float subt, size_t len)
Definition: FormatClassifier.cpp:276

FormatClassifier::GetResultFormat
FormatClassT GetResultFormat()
Definition: FormatClassifier.cpp:77

FormatClassifier::cNumInts
static const size_t cNumInts
Definition: FormatClassifier.h:72

FormatClassifier::mRawBuffer
ArrayOf< uint8_t > mRawBuffer
Definition: FormatClassifier.h:84

FormatClassifier::Run
void Run()
Definition: FormatClassifier.cpp:129

FormatClassifier::Div
void Div(float *in, float div, size_t len)
Definition: FormatClassifier.cpp:284

FormatClassifier::mMonoFeat
Floats mMonoFeat
Definition: FormatClassifier.h:86

FormatClassifier::mStereoFeat
Floats mStereoFeat
Definition: FormatClassifier.h:87

FormatClassifier::mResultChannels
unsigned mResultChannels
Definition: FormatClassifier.h:90

FormatClassifier::GetResultChannels
unsigned GetResultChannels()
Definition: FormatClassifier.cpp:124

FormatClassifier::Add
void Add(float *in1, float *in2, size_t len)
Definition: FormatClassifier.cpp:268

FormatClassifier::mClasses
FormatVectorT mClasses
Definition: FormatClassifier.h:74

FormatClassifier::Mean
float Mean(float *in, size_t len)
Definition: FormatClassifier.cpp:308

FormatClassifier::FormatClassifier
FormatClassifier(const char *filename)
Definition: FormatClassifier.cpp:31

FormatClassifier::mMeter
SpecPowerCalculation mMeter
Definition: FormatClassifier.h:76

FormatClassifier::GetResultFormatLibSndfile
int GetResultFormatLibSndfile()
Definition: FormatClassifier.cpp:82

FormatClassifier::cSiglen
static const size_t cSiglen
Definition: FormatClassifier.h:71

FormatClassifier::Max
float Max(float *in, size_t len)
Definition: FormatClassifier.cpp:322

FormatClassifier::ReadSignal
void ReadSignal(FormatClassT format, size_t stride)
Definition: FormatClassifier.cpp:199

MachineEndianness::Big
@ Big
Definition: MultiFormatReader.h:23

MachineEndianness::Little
@ Little
Definition: MultiFormatReader.h:22

MultiFormatReader::ReadSamples
size_t ReadSamples(void *buffer, size_t len, MultiFormatReader::FormatT format, MachineEndianness::EndiannessT end)
Definition: MultiFormatReader.cpp:66

MultiFormatReader::Float
@ Float
Definition: MultiFormatReader.h:64

MultiFormatReader::Int8
@ Int8
Definition: MultiFormatReader.h:58

MultiFormatReader::Uint8
@ Uint8
Definition: MultiFormatReader.h:61

MultiFormatReader::Uint32
@ Uint32
Definition: MultiFormatReader.h:63

MultiFormatReader::Int32
@ Int32
Definition: MultiFormatReader.h:60

MultiFormatReader::Double
@ Double
Definition: MultiFormatReader.h:65

MultiFormatReader::Uint16
@ Uint16
Definition: MultiFormatReader.h:62

MultiFormatReader::Int16
@ Int16
Definition: MultiFormatReader.h:59

MultiFormatReader::Reset
void Reset()
Definition: MultiFormatReader.cpp:58

SpecPowerCalculation::CalcPower
float CalcPower(float *sig, float fc, float bw)
Definition: SpecPowerMeter.cpp:39

anonymous_namespace{ExportPCM.cpp}::format
int format
Definition: ExportPCM.cpp:49

FormatClassifier::FormatClassT
Definition: FormatClassifier.h:61

FormatClassifier::FormatClassT::format
MultiFormatReader::FormatT format
Definition: FormatClassifier.h:62

FormatClassifier::FormatClassT::endian
MachineEndianness::EndiannessT endian
Definition: FormatClassifier.h:63