_spectral_data_manager_8cpp_source.html

/**********************************************************************


  Audacity: A Digital Audio Editor


  SpectralDataManager.cpp


  Edward Hui


*******************************************************************//*******************************************************************/


#include <iostream>

#include "FFT.h"

#include "ProjectHistory.h"

#include "SpectralDataManager.h"

#include "WaveTrack.h"


SpectralDataManager::SpectralDataManager()= default;


SpectralDataManager::~SpectralDataManager()= default;


struct SpectralDataManager::Setting{

   eWindowFunctions mInWindowType = eWinFuncHann;

   eWindowFunctions mOutWindowType = eWinFuncHann;

   size_t mWindowSize = 2048;

   unsigned mStepsPerWindow = 4;

   bool mLeadingPadding = true;

   bool mTrailingPadding = true;

   bool mNeedOutput = true;

};


namespace {

const std::shared_ptr<SpectralData> FindSpectralData(Channel *pChannel)

{

   auto &view = ChannelView::Get(*pChannel);

   if (auto waveChannelViewPtr = dynamic_cast<WaveChannelView*>(&view)){

      for (const auto &subViewPtr : waveChannelViewPtr->GetAllSubViews()){

         if (subViewPtr->IsSpectral()) {

            auto sView =

               std::static_pointer_cast<SpectrumView>(subViewPtr).get();

            const auto pData = sView->GetSpectralData();

            if (!pData->dataHistory.empty()) {

               return pData;

            }

         }

      }

   }

   return {};

}

}


bool SpectralDataManager::ProcessTracks(AudacityProject &project){

   auto &tracks = TrackList::Get(project);

   int applyCount = 0;

   Setting setting;

   for (auto wt : tracks.Any<WaveTrack>()) {

      using Type = long long;

      Type startSample{ std::numeric_limits<Type>::max() };

      Type endSample{ std::numeric_limits<Type>::min() };

      for (auto pChannel : wt->Channels()) {

         if (const auto pData = FindSpectralData(pChannel.get())) {

            const auto &hopSize = pData->GetHopSize();

            auto start = pData->GetStartSample();

            endSample = std::max(endSample, pData->GetEndSample());


            // Correct the start of range so that the first full window is

            // centered at that position

            start = std::max(static_cast<long long>(0), start - 2 * hopSize);

            startSample = std::min(startSample, start);

         }

      }

      if (startSample >= endSample)

         continue;

      const auto t0 = wt->LongSamplesToTime(startSample);

      const auto len = endSample - startSample;

      const auto tLen = wt->LongSamplesToTime(len);

      auto tempTrack = wt->EmptyCopy();

      auto iter = tempTrack->Channels().begin();

      long long processed{};

      for (auto pChannel : wt->Channels()) {

         Worker worker{ (*iter++).get(), setting };

         auto &view = ChannelView::Get(*pChannel);


         if (auto waveChannelViewPtr = dynamic_cast<WaveChannelView*>(&view)){

            for (const auto &subViewPtr : waveChannelViewPtr->GetAllSubViews()){

               if (!subViewPtr->IsSpectral())

                  continue;

               auto sView = std::static_pointer_cast<SpectrumView>(subViewPtr).get();

               auto pSpectralData = sView->GetSpectralData();


               if (!pSpectralData->dataHistory.empty()) {

                  // TODO make this correct in case start or end of spectral data in

                  // the channels differs

                  processed = std::max(processed, pSpectralData->GetLength());

                  worker.Process(*pChannel, pSpectralData);

                  applyCount += static_cast<int>(pSpectralData->dataHistory.size());

                  pSpectralData->clearAllData();

               }

            }

         }

      }

      if (tempTrack) {

         TrackSpectrumTransformer::PostProcess(*tempTrack, processed);

         // Take the output track and insert it in place of the original

         // sample data

         // TODO make this correct in case start or end of spectral data in

         // the channels differs

         wt->ClearAndPaste(t0, t0 + tLen, *tempTrack, true, false);

      }

   }


   if (applyCount) {

      ProjectHistory::Get(project).PushState(

            XO("Applied effect to selection"),

            XO("Applied effect to selection"));

      ProjectHistory::Get(project).ModifyState(true);

   }


   return applyCount > 0;

}


int SpectralDataManager::FindFrequencySnappingBin(const WaveChannel &channel,

   long long int startSC, int hopSize, double threshold, int targetFreqBin)

{

   Setting setting;

   setting.mNeedOutput = false;

   Worker worker{ nullptr, setting };


   return worker.ProcessSnapping(

      channel, startSC, hopSize, setting.mWindowSize, threshold, targetFreqBin);

}


std::vector<int> SpectralDataManager::FindHighestFrequencyBins(WaveChannel &wc,

                                                          long long int startSC,

                                                          int hopSize,

                                                          double threshold,

                                                          int targetFreqBin)

 {

   Setting setting;

   setting.mNeedOutput = false;

   Worker worker{ nullptr, setting };


   return worker.ProcessOvertones(wc, startSC, hopSize, setting.mWindowSize, threshold, targetFreqBin);

 }


SpectralDataManager::Worker::Worker(

   WaveChannel *pChannel, const Setting &setting

)  : TrackSpectrumTransformer{ pChannel,

      setting.mNeedOutput, setting.mInWindowType, setting.mOutWindowType,

      setting.mWindowSize, setting.mStepsPerWindow,

      setting.mLeadingPadding, setting.mTrailingPadding

   }

// Work members

{

}


SpectralDataManager::Worker::~Worker() = default;


bool SpectralDataManager::Worker::DoStart() {

   return TrackSpectrumTransformer::DoStart();

}

bool SpectralDataManager::Worker::DoFinish() {

   return TrackSpectrumTransformer::DoFinish();

}


bool SpectralDataManager::Worker::Process(const WaveChannel &channel,

   const std::shared_ptr<SpectralData> &pSpectralData)

{

   mpSpectralData = pSpectralData;

   const auto hopSize = mpSpectralData->GetHopSize();

   const auto startSample = mpSpectralData->GetStartSample();

   // Correct the first hop num, because SpectrumTransformer will send

   // a few initial windows that overlay the range only partially

   mStartHopNum = startSample / hopSize - (mStepsPerWindow - 1);

   mWindowCount = 0;

   return TrackSpectrumTransformer::Process(Processor, channel, 1,

      mpSpectralData->GetCorrectedStartSample(), mpSpectralData->GetLength());

}


int SpectralDataManager::Worker::ProcessSnapping(const WaveChannel &channel,

   long long startSC, int hopSize, size_t winSize, double threshold,

   int targetFreqBin)

{

   mSnapThreshold = threshold;

   mSnapTargetFreqBin = targetFreqBin;

   mSnapSamplingRate = channel.GetTrack().GetRate();


   startSC = std::max(static_cast<long long>(0), startSC - 2 * hopSize);

   // The calculated frequency peak will be stored in mReturnFreq

   if (!TrackSpectrumTransformer::Process(SnappingProcessor, channel,

      1, startSC, winSize))

      return 0;


   return mSnapReturnFreqBin;

}


std::vector<int> SpectralDataManager::Worker::ProcessOvertones(

   const WaveChannel &channel, long long startSC, int hopSize, size_t winSize,

   double threshold, int targetFreqBin)

{

   mOvertonesThreshold = threshold;

   mSnapTargetFreqBin = targetFreqBin;

   mSnapSamplingRate = channel.GetTrack().GetRate();


   startSC = std::max(static_cast<long long>(0), startSC - 2 * hopSize);

   // The calculated multiple frequency peaks will be stored in mOvertonesTargetFreqBin

   TrackSpectrumTransformer::Process(

      OvertonesProcessor, channel, 1, startSC, winSize);

   return move( mOvertonesTargetFreqBin );

 }


bool SpectralDataManager::Worker::SnappingProcessor(SpectrumTransformer &transformer) {

   auto &worker = static_cast<Worker &>(transformer);

   // Compute power spectrum in the newest window

   {

      MyWindow &record = worker.NthWindow(0);

      float *pSpectrum = &record.mSpectrums[0];

      const double dc = record.mRealFFTs[0];

      *pSpectrum++ = dc * dc;

      float *pReal = &record.mRealFFTs[1], *pImag = &record.mImagFFTs[1];

      for (size_t nn = worker.mSpectrumSize - 2; nn--;) {

         const double re = *pReal++, im = *pImag++;

         *pSpectrum++ = re * re + im * im;

      }

      const double nyquist = record.mImagFFTs[0];

      *pSpectrum = nyquist * nyquist;


      const double &sr = worker.mSnapSamplingRate;

      const double nyquistRate = sr / 2;

      const double &threshold = worker.mSnapThreshold;

      const double &spectrumSize = worker.mSpectrumSize;

      const int &targetBin = worker.mSnapTargetFreqBin;


      int binBound = spectrumSize * threshold;

      float maxValue = std::numeric_limits<float>::min();


      // Skip the first and last bin

      for(int i = -binBound; i < binBound; i++){

         int idx = std::clamp(targetBin + i, 0, static_cast<int>(spectrumSize - 1));

         if(record.mSpectrums[idx] > maxValue){

            maxValue = record.mSpectrums[idx];

            // Update the return frequency

            worker.mSnapReturnFreqBin = idx;

         }

      }

   }


   return true;

}


bool SpectralDataManager::Worker::OvertonesProcessor(SpectrumTransformer &transformer) {

   auto &worker = static_cast<Worker &>(transformer);

   // Compute power spectrum in the newest window

   {

      MyWindow &record = worker.NthWindow(0);

      float *pSpectrum = &record.mSpectrums[0];

      const double dc = record.mRealFFTs[0];

      *pSpectrum++ = dc * dc;

      float *pReal = &record.mRealFFTs[1], *pImag = &record.mImagFFTs[1];

      for (size_t nn = worker.mSpectrumSize - 2; nn--;) {

         const double re = *pReal++, im = *pImag++;

         *pSpectrum++ = re * re + im * im;

      }

      const double nyquist = record.mImagFFTs[0];

      *pSpectrum = nyquist * nyquist;


      const double &spectrumSize = worker.mSpectrumSize;

      const int &targetBin = worker.mSnapTargetFreqBin;


      float targetValue = record.mSpectrums[targetBin];


      double fundamental = targetBin;

      int overtone = 2, binNum = 0;

      pSpectrum = &record.mSpectrums[0];

      while ( fundamental >= 1 &&

         ( binNum = lrint( fundamental * overtone )  ) < spectrumSize) {

         // Examine a few bins each way up and down

         constexpr int tolerance = 3;

         auto begin = pSpectrum + std::max( 0, binNum - (tolerance + 1) );

         auto end = pSpectrum +

            std::min<size_t>( spectrumSize, binNum + (tolerance + 1) + 1 );

         auto peak = std::max_element( begin, end );


         // Abandon if the peak is too far up or down

         if ( peak == begin || peak == end - 1 )

            break;


         int newBin = peak - pSpectrum;

         worker.mOvertonesTargetFreqBin.push_back(newBin);

         // Correct the estimate of the fundamental

         fundamental = double(newBin) / overtone++;

      }

   }

   return true;

}


bool SpectralDataManager::Worker::Processor(SpectrumTransformer &transformer)

{

   auto &worker = static_cast<Worker &>(transformer);

   // Compute power spectrum in the newest window

   {

      MyWindow &record = worker.NthWindow(0);

      float *pSpectrum = &record.mSpectrums[0];

      const double dc = record.mRealFFTs[0];

      *pSpectrum++ = dc * dc;

      float *pReal = &record.mRealFFTs[1], *pImag = &record.mImagFFTs[1];

      for (size_t nn = worker.mSpectrumSize - 2; nn--;) {

         const double re = *pReal++, im = *pImag++;

         *pSpectrum++ = re * re + im * im;

      }

      const double nyquist = record.mImagFFTs[0];

      *pSpectrum = nyquist * nyquist;

   }


   worker.ApplyEffectToSelection();

   return true;

}


bool SpectralDataManager::Worker::ApplyEffectToSelection() {

   auto &record = NthWindow(0);


   for(auto &spectralDataMap: mpSpectralData->dataHistory){

      // For all added frequency

      for(const int &freqBin: spectralDataMap[mStartHopNum]){

         record.mRealFFTs[freqBin] = 0;

         record.mImagFFTs[freqBin] = 0;

      }

   }


   mWindowCount++;

   mStartHopNum ++;

   return true;

}


auto SpectralDataManager::Worker::NewWindow(size_t windowSize)

-> std::unique_ptr<Window>

{

   return std::make_unique<MyWindow>(windowSize);

}


SpectralDataManager::Worker::MyWindow::~MyWindow() {


}

min
int min(int a, int b)
Definition: CompareAudioCommand.cpp:114

FFT.h

eWindowFunctions
eWindowFunctions
Definition: FFT.h:110

eWinFuncHann
@ eWinFuncHann
Definition: FFT.h:114

XO
XO("Cut/Copy/Paste")

ProjectHistory.h

SpectralDataManager.h

tracks
const auto tracks
Definition: TestWaveTrackMaker.cpp:19

project
const auto project
Definition: TestWaveTrackMaker.cpp:18

WaveTrack.h

AudacityProject
The top-level handle to an Audacity project. It serves as a source of events that other objects can b...
Definition: Project.h:90

Channel
Definition: Channel.h:159

ChannelView::Get
static ChannelView & Get(Channel &channel)
Definition: ChannelView.cpp:223

ProjectHistory::PushState
void PushState(const TranslatableString &desc, const TranslatableString &shortDesc)
Definition: ProjectHistory.cpp:64

ProjectHistory::ModifyState
void ModifyState(bool bWantsAutoSave)
Definition: ProjectHistory.cpp:92

ProjectHistory::Get
static ProjectHistory & Get(AudacityProject &project)
Definition: ProjectHistory.cpp:22

SpectralDataManager::Worker
Definition: SpectralDataManager.h:41

SpectralDataManager::Worker::Worker
Worker(WaveChannel *pChannel, const Setting &setting)
Definition: SpectralDataManager.cpp:150

SpectralDataManager::Worker::~Worker
~Worker()

SpectralDataManager::Worker::ProcessOvertones
std::vector< int > ProcessOvertones(const WaveChannel &channel, long long int startSC, int hopSize, size_t winSize, double threshold, int targetFreqBin)
Definition: SpectralDataManager.cpp:201

SpectralDataManager::Worker::ApplyEffectToSelection
bool ApplyEffectToSelection()
Definition: SpectralDataManager.cpp:323

SpectralDataManager::Worker::DoFinish
bool DoFinish() override
Called after the last call to ProcessWindow().
Definition: SpectralDataManager.cpp:166

SpectralDataManager::Worker::DoStart
bool DoStart() override
Called before any calls to ProcessWindow.
Definition: SpectralDataManager.cpp:163

SpectralDataManager::Worker::NewWindow
std::unique_ptr< Window > NewWindow(size_t windowSize) override
Allocates a window to place in the queue.
Definition: SpectralDataManager.cpp:339

SpectralDataManager::Worker::ProcessSnapping
int ProcessSnapping(const WaveChannel &channel, long long int startSC, int hopSize, size_t winSize, double threshold, int targetFreqBin)
Definition: SpectralDataManager.cpp:184

SpectralDataManager::Worker::Process
bool Process(const WaveChannel &channel, const std::shared_ptr< SpectralData > &sDataPtr)
Definition: SpectralDataManager.cpp:170

SpectralDataManager::Worker::OvertonesProcessor
static bool OvertonesProcessor(SpectrumTransformer &transformer)
Definition: SpectralDataManager.cpp:255

SpectralDataManager::Worker::Processor
static bool Processor(SpectrumTransformer &transformer)
Definition: SpectralDataManager.cpp:301

SpectralDataManager::Worker::SnappingProcessor
static bool SnappingProcessor(SpectrumTransformer &transformer)
Definition: SpectralDataManager.cpp:216

SpectralDataManager::FindHighestFrequencyBins
static std::vector< int > FindHighestFrequencyBins(WaveChannel &wc, long long int startSC, int hopSize, double threshold, int targetFreqBin)
Definition: SpectralDataManager.cpp:137

SpectralDataManager::ProcessTracks
static bool ProcessTracks(AudacityProject &project)
Definition: SpectralDataManager.cpp:56

SpectralDataManager::FindFrequencySnappingBin
static int FindFrequencySnappingBin(const WaveChannel &channel, long long startSC, int hopSize, double threshold, int targetFreqBin)
Definition: SpectralDataManager.cpp:126

SpectralDataManager::SpectralDataManager
SpectralDataManager()

SpectralDataManager::~SpectralDataManager
~SpectralDataManager()

SpectrumTransformer
A class that transforms a portion of a wave track (preserving duration) by applying Fourier transform...
Definition: SpectrumTransformer.h:34

TrackList::Get
static TrackList & Get(AudacityProject &project)
Definition: Track.cpp:314

TrackSpectrumTransformer
Subclass of SpectrumTransformer that rewrites a track.
Definition: TrackSpectrumTransformer.h:20

TrackSpectrumTransformer::DoFinish
bool DoFinish() override
Called after the last call to ProcessWindow().
Definition: TrackSpectrumTransformer.cpp:51

TrackSpectrumTransformer::PostProcess
static bool PostProcess(WaveTrack &outputTrack, sampleCount len)
Final flush and trimming of tail samples.
Definition: TrackSpectrumTransformer.cpp:56

TrackSpectrumTransformer::DoStart
bool DoStart() override
Called before any calls to ProcessWindow.
Definition: TrackSpectrumTransformer.cpp:69

TrackSpectrumTransformer::Process
bool Process(const WindowProcessor &processor, const WaveChannel &channel, size_t queueLength, sampleCount start, sampleCount len)
Invokes Start(), ProcessSamples(), and Finish()
Definition: TrackSpectrumTransformer.cpp:20

WaveChannel
Definition: WaveTrack.h:84

WaveChannel::GetTrack
WaveTrack & GetTrack()
Definition: WaveTrack.h:841

WaveChannelView
Definition: WaveChannelView.h:100

WaveTrack
A Track that contains audio waveform data.
Definition: WaveTrack.h:203

WaveTrack::GetRate
double GetRate() const override
Definition: WaveTrack.cpp:821

lrint
#define lrint(dbl)
Definition: float_cast.h:169

anonymous_namespace{SpectralDataManager.cpp}::FindSpectralData
const std::shared_ptr< SpectralData > FindSpectralData(Channel *pChannel)
Definition: SpectralDataManager.cpp:37

details::end
const char * end(const char *str) noexcept
Definition: StringUtils.h:106

details::begin
const char * begin(const char *str) noexcept
Definition: StringUtils.h:101

SpectralDataManager::Setting
Definition: SpectralDataManager.cpp:26

SpectralDataManager::Setting::mWindowSize
size_t mWindowSize
Definition: SpectralDataManager.cpp:29

SpectralDataManager::Setting::mNeedOutput
bool mNeedOutput
Definition: SpectralDataManager.cpp:33

SpectralDataManager::Setting::mOutWindowType
eWindowFunctions mOutWindowType
Definition: SpectralDataManager.cpp:28

SpectralDataManager::Setting::mTrailingPadding
bool mTrailingPadding
Definition: SpectralDataManager.cpp:32

SpectralDataManager::Setting::mInWindowType
eWindowFunctions mInWindowType
Definition: SpectralDataManager.cpp:27

SpectralDataManager::Setting::mStepsPerWindow
unsigned mStepsPerWindow
Definition: SpectralDataManager.cpp:30

SpectralDataManager::Setting::mLeadingPadding
bool mLeadingPadding
Definition: SpectralDataManager.cpp:31

SpectralDataManager::Worker::MyWindow
Definition: SpectralDataManager.h:47

SpectralDataManager::Worker::MyWindow::~MyWindow
~MyWindow() override
Definition: SpectralDataManager.cpp:345

SpectralDataManager::Worker::MyWindow::mSpectrums
FloatVector mSpectrums
Definition: SpectralDataManager.h:57