_block_hasher_8cpp_source.html

/*  SPDX-License-Identifier: GPL-2.0-or-later */

/*!********************************************************************


  Audacity: A Digital Audio Editor


  BlockHasher.cpp


  Dmitry Vedenko


**********************************************************************/

#include "BlockHasher.h"


#include <algorithm>

#include <atomic>

#include <future>

#include <utility>


#include "MemoryX.h"

#include "SampleBlock.h"


#include "crypto/SHA256.h"


namespace audacity::cloud::audiocom::sync

{

class BlockHasher::Workers final

{

public:

   using SampleData = std::vector<std::remove_pointer_t<samplePtr>>;


   explicit Workers(

      BlockHashCache& cache, const std::vector<LockedBlock> blocks,

      std::function<void()> onComplete)

       : mThreadsCount { std::max(1u, std::thread::hardware_concurrency() / 2) }

       , mCache { cache }

       , mOnComplete { std::move(onComplete) }

   {

      mResults.reserve(mThreadsCount);


      const auto blocksCount = blocks.size();

      // Try to add no more that 1 extra block per thread

      const size_t blockPerThread = blocks.size() / mThreadsCount + 1;


      for (size_t i = 0; i < mThreadsCount; ++i)

      {

         const size_t startIndex = i;


         if (startIndex >= blocks.size())

            break;


         std::vector<LockedBlock> threadBlocks;

         threadBlocks.reserve(blockPerThread);


         for (size_t j = startIndex; j < blocksCount; j += mThreadsCount)

            threadBlocks.emplace_back(blocks[j]);


         mResults.emplace_back(std::async(

            std::launch::async,

            [this, threadBlocks = std::move(threadBlocks)]()

            {

               Result result;

               SampleData sampleData;


               for (const auto& block : threadBlocks)

                  result.emplace(block.Id, ComputeHash(sampleData, block));


               return result;

            }));

      }


      mWaiter = std::async(

         std::launch::async,

         [this]

         {

            for (auto& fut : mResults)

               fut.wait();


            NotifyReady();

         });

   }


   bool IsReady() const

   {

      return std::all_of(

         mResults.begin(), mResults.end(),

         [](const auto& result)

         {

            return result.wait_for(std::chrono::seconds(0)) ==

                   std::future_status::ready;

         });

   }


   std::pair<std::string, bool>

   ComputeHash(SampleData& sampleData, const LockedBlock& block) const

   {

      assert(block.Id >= 0);

      if(block.Id < 0)

         return {{}, false};


      std::string hash;


      if (mCache.GetHash(block.Id, hash))

         return { hash, false };


      const auto sampleFormat = block.Format;

      const auto sampleCount  = block.Block->GetSampleCount();

      const auto dataSize     = sampleCount * SAMPLE_SIZE(sampleFormat);


      sampleData.resize(dataSize);


      const size_t samplesRead = block.Block->GetSamples(

         sampleData.data(), sampleFormat, 0, sampleCount, false);


      if (samplesRead != sampleCount)

         return { {}, false };


      hash = crypto::sha256(sampleData);


      return { hash, true };

   }


   void NotifyReady()

   {

      if (mOnComplete)

         mOnComplete();

   }


   std::vector<std::pair<int64_t, std::string>> TakeResult()

   {

      std::vector<std::pair<int64_t, std::string>> result;


      for (auto& fut : mResults)

      {

         const auto& threadResult = fut.get();


         for (const auto& [id, hash] : threadResult)

         {

            result.emplace_back(std::make_pair(id, hash.first));


            if (hash.second)

               mCache.UpdateHash(id, hash.first);

         }

      }


      mResults.clear();


      return result;

   }


private:

   const size_t mThreadsCount;


   BlockHashCache& mCache;


   using Result = std::unordered_map<int64_t, std::pair<std::string, bool>>;

   std::vector<std::future<Result>> mResults;

   std::future<void> mWaiter;


   std::function<void()> mOnComplete;

};


BlockHasher::BlockHasher()  = default;

BlockHasher::~BlockHasher() = default;


bool BlockHasher::ComputeHashes(

   BlockHashCache& cache, std::vector<LockedBlock> blocks,

   std::function<void()> onComplete)

{

   if (mWorkers != nullptr && !mWorkers->IsReady())

      return false;


   if (blocks.empty())

   {

      if (onComplete)

         onComplete();


      return true;

   }


   mWorkers = std::make_unique<Workers>(

      cache, std::move(blocks), std::move(onComplete));


   return true;

}


bool BlockHasher::IsReady() const

{

   return mWorkers != nullptr && mWorkers->IsReady();

}


std::vector<std::pair<int64_t, std::string>> BlockHasher::TakeResult()

{

   if (mWorkers == nullptr)

      return {};


   return mWorkers->TakeResult();

}


} // namespace audacity::cloud::audiocom::sync

BlockHasher.h

MemoryX.h

SHA256.h

SampleBlock.h

sampleFormat
sampleFormat
The ordering of these values with operator < agrees with the order of increasing bit width.
Definition: SampleFormat.h:30

SAMPLE_SIZE
#define SAMPLE_SIZE(SampleFormat)
Definition: SampleFormat.h:52

audacity::cloud::audiocom::sync::BlockHashCache
Definition: BlockHasher.h:25

audacity::cloud::audiocom::sync::BlockHashCache::UpdateHash
virtual void UpdateHash(int64_t blockId, const std::string &hash)=0

audacity::cloud::audiocom::sync::BlockHashCache::GetHash
virtual bool GetHash(int64_t blockId, std::string &hash) const =0

audacity::cloud::audiocom::sync::BlockHasher::Workers
Definition: BlockHasher.cpp:26

audacity::cloud::audiocom::sync::BlockHasher::Workers::mOnComplete
std::function< void()> mOnComplete
Definition: BlockHasher.cpp:158

audacity::cloud::audiocom::sync::BlockHasher::Workers::NotifyReady
void NotifyReady()
Definition: BlockHasher.cpp:121

audacity::cloud::audiocom::sync::BlockHasher::Workers::mThreadsCount
const size_t mThreadsCount
Definition: BlockHasher.cpp:150

audacity::cloud::audiocom::sync::BlockHasher::Workers::mResults
std::vector< std::future< Result > > mResults
Definition: BlockHasher.cpp:155

audacity::cloud::audiocom::sync::BlockHasher::Workers::ComputeHash
std::pair< std::string, bool > ComputeHash(SampleData &sampleData, const LockedBlock &block) const
Definition: BlockHasher.cpp:93

audacity::cloud::audiocom::sync::BlockHasher::Workers::mWaiter
std::future< void > mWaiter
Definition: BlockHasher.cpp:156

audacity::cloud::audiocom::sync::BlockHasher::Workers::mCache
BlockHashCache & mCache
Definition: BlockHasher.cpp:152

audacity::cloud::audiocom::sync::BlockHasher::Workers::Workers
Workers(BlockHashCache &cache, const std::vector< LockedBlock > blocks, std::function< void()> onComplete)
Definition: BlockHasher.cpp:30

audacity::cloud::audiocom::sync::BlockHasher::Workers::Result
std::unordered_map< int64_t, std::pair< std::string, bool > > Result
Definition: BlockHasher.cpp:154

audacity::cloud::audiocom::sync::BlockHasher::Workers::IsReady
bool IsReady() const
Definition: BlockHasher.cpp:81

audacity::cloud::audiocom::sync::BlockHasher::Workers::TakeResult
std::vector< std::pair< int64_t, std::string > > TakeResult()
Definition: BlockHasher.cpp:127

audacity::cloud::audiocom::sync::BlockHasher::Workers::SampleData
std::vector< std::remove_pointer_t< samplePtr > > SampleData
Definition: BlockHasher.cpp:28

audacity::cloud::audiocom::sync::BlockHasher::ComputeHashes
bool ComputeHashes(BlockHashCache &cache, std::vector< LockedBlock > blocks, std::function< void()> onComplete)
Definition: BlockHasher.cpp:164

audacity::cloud::audiocom::sync::BlockHasher::IsReady
bool IsReady() const
Definition: BlockHasher.cpp:185

audacity::cloud::audiocom::sync::BlockHasher::BlockHasher
BlockHasher()

audacity::cloud::audiocom::sync::BlockHasher::mWorkers
std::unique_ptr< Workers > mWorkers
Definition: BlockHasher.h:50

audacity::cloud::audiocom::sync::BlockHasher::~BlockHasher
~BlockHasher()

audacity::cloud::audiocom::sync::BlockHasher::TakeResult
std::vector< std::pair< int64_t, std::string > > TakeResult()
Definition: BlockHasher.cpp:190

sampleCount
Positions or offsets within audio files need a wide type.
Definition: SampleCount.h:19

audacity::cloud::audiocom::sync
Definition: CloudSyncService.h:31

crypto::sha256
std::string sha256(const T &data)
Definition: SHA256.h:50

std
STL namespace.

audacity::cloud::audiocom::sync::LockedBlock
Definition: CloudSyncDTO.h:37

audacity::cloud::audiocom::sync::LockedBlock::Id
BlockID Id
Definition: CloudSyncDTO.h:38

audacity::cloud::audiocom::sync::LockedBlock::Format
sampleFormat Format
Definition: CloudSyncDTO.h:39

audacity::cloud::audiocom::sync::LockedBlock::Block
SampleBlockPtr Block
Definition: CloudSyncDTO.h:40