balibabu commited on
Commit
c058dac
·
1 Parent(s): 0dc6759

feat: Add html to the description text of the parsing method general #336 (#2432)

Browse files

### What problem does this PR solve?

feat: Add html to the description text of the parsing method general
#336

### Type of change

- [x] New Feature (non-breaking change which adds functionality)

web/src/locales/en.ts CHANGED
@@ -200,7 +200,7 @@ export default {
200
  We assume manual has hierarchical section structure. We use the lowest section titles as pivots to slice documents.
201
  So, the figures and tables in the same section will not be sliced apart, and chunk size might be large.
202
  </p>`,
203
- naive: `<p>Supported file formats are <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML</b>.</p>
204
  <p>This method apply the naive ways to chunk files: </p>
205
  <p>
206
  <li>Successive text will be sliced into pieces using vision detection model.</li>
 
200
  We assume manual has hierarchical section structure. We use the lowest section titles as pivots to slice documents.
201
  So, the figures and tables in the same section will not be sliced apart, and chunk size might be large.
202
  </p>`,
203
+ naive: `<p>Supported file formats are <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>
204
  <p>This method apply the naive ways to chunk files: </p>
205
  <p>
206
  <li>Successive text will be sliced into pieces using vision detection model.</li>
web/src/locales/zh-traditional.ts CHANGED
@@ -191,7 +191,7 @@ export default {
191
  我們假設手冊具有分層部分結構。我們使用最低的部分標題作為對文檔進行切片的樞軸。
192
  因此,同一部分中的圖和表不會被分割,並且塊大小可能會很大。
193
  </p>`,
194
- naive: `<p>支持的文件格式為<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>。</p>
195
  <p>此方法將簡單的方法應用於塊文件:</p>
196
  <p>
197
  <li>系統將使用視覺檢測模型將連續文本分割成多個片段。</li>
 
191
  我們假設手冊具有分層部分結構。我們使用最低的部分標題作為對文檔進行切片的樞軸。
192
  因此,同一部分中的圖和表不會被分割,並且塊大小可能會很大。
193
  </p>`,
194
+ naive: `<p>支持的文件格式為<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
195
  <p>此方法將簡單的方法應用於塊文件:</p>
196
  <p>
197
  <li>系統將使用視覺檢測模型將連續文本分割成多個片段。</li>
web/src/locales/zh.ts CHANGED
@@ -192,7 +192,7 @@ export default {
192
  我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
193
  因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
194
  </p>`,
195
- naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>。</p>
196
  <p>此方法将简单的方法应用于块文件:</p>
197
  <p>
198
  <li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
 
192
  我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
193
  因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
194
  </p>`,
195
+ naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
196
  <p>此方法将简单的方法应用于块文件:</p>
197
  <p>
198
  <li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>